AI経営12分

AIに仕事を分担させてみた── Claude Codeでエージェントチームを設計した実録

RA

Kei(Revival Asia)

代表 立川 慶弥 監修 | 株式会社リバイバルアジア

AI活用Claude Codeエージェントチーム業務効率化非エンジニア向け

# Claude Codeでエージェントチームを設計した実録──AIに仕事を分担させた話

「AIに頼んでも、なぜかズレた答えが返ってくる」

これ、AI使い始めた多くの方が感じる壁です。私もそうでした。指示を出すたびに「そうじゃない」と思いながら修正を繰り返す日々。AIを使っているのに、かえって手間が増えている気がしていました。

その問題を解決するために試みたのが、AIを「1人のアシスタント」ではなく「チームとして動かす」設計です。ツールはClaude Code(Anthropicが提供するAI開発環境)。プログラミング経験がない私が、4回のバージョンアップを経てたどり着いた設計の話をお伝えします。

> この記事で扱う主な定義

>

> - AIエージェントチーム: 役割を分担した複数のAIが連携して一つのタスクを処理する仕組み。調査・分析・批評・統合など各工程を専門のAIが担うことで、1人のAIでは難しかった精度と効率を実現する。

> - Claude Code: Anthropic社が提供するターミナルベースのAIコーディングアシスタント。日本語で指示するだけでAIがコードを書いてくれるため、非エンジニアでも業務自動化の設計が可能。

> - Haiku / Sonnet / Opus: Anthropicが提供するAIモデルの3段階。Haikuは軽量・高速、Sonnetはバランス型、Opusは最高精度。

> - Lite / Standard / Full: 本記事で設計したエージェントチームの処理モード。依頼の複雑さに応じて使い分ける。

AIへの依頼がズレる、本当の理由

最初に誤解を解いておきたいのですが、「AIがズレる」のはAIの性能の問題ではありません。多くの場合、原因は依頼の設計にあります。

たとえば会社で新しいスタッフを採用したとして、「これ、うまくやっておいて」と言うだけでは、相手は何を期待されているかわかりませんよね。AIも同じです。依頼の背景、ゴール、どのレベルの精度が必要か──これらが整理されていないと、どれだけ優秀なAIでも「なんか違う」結果を出します。

では、どうすればいいか。私が出した答えは「AIに仕事の全体設計を任せる前に、まず依頼を整理するAIを置く」というものでした。

「1人のAI」から「AIチーム」へ

一般的なAI活用は、1人のアシスタントにあれこれ頼む形です。でもそれには限界があります。

人間でも同じですが、「調査もして、分析もして、文章もまとめて、批評もして」と1人に頼むと、どれも中途半端になります。専門家を分けるべきです。

AIエージェントチームとは、役割を分担した複数のAIが、順番に・あるいは同時に動く仕組みのことです。

  • ヒアリング担当AI(要件を整理する)
  • 調査・分析担当AI(専門知識で深掘りする)
  • 批評担当AI(問題点を指摘する)
  • 最終判断担当AI(結論をまとめる)

これを「人手をかけずに自動で回す」というのが、私が設計したシステムの核心です。

v1の失敗──全員を毎回フル稼働させた結果

最初に作ったv1は、シンプルでした。

「専門家AIを3名用意して、毎回全員に動いてもらう」

結果は惨敗でした。

何が問題だったか。まずコストです。AIは処理量(トークン)に応じてコストがかかります。軽い依頼でも重い依頼でも、毎回3名フル稼働では費用対効果が悪すぎる。

そして方向性のズレ。3人が独立して動くので、それぞれが「自分の専門」を優先した回答を出します。統合する役がいないから、最後に私が全部読んで判断するはめに。結局、手間が増えただけでした。

> [!warning]

> v1の教訓:「専門家を増やせば品質が上がる」は誤り。統合設計なしに人数を増やしても混乱が増えるだけ。

v2の改善──「ちゃんと聞いてもらう」仕組みを作った

v1の反省を踏まえ、v2で追加したのは2つです。

1. ヒアリングフェーズ

依頼を受けたらまず「何をしたいのか、どんな結果が欲しいのか」をAIが聞いてくる。そして私が承認するまで次に進まない設計にしました。

「それ、普通のチャットでもやってるじゃないか」と思うかもしれません。でも大きな違いがあります。チャットはその場限りの会話ですが、エージェントシステムでは、このヒアリング結果が後続の全AIに引き渡されます。最初の確認が精密であるほど、全体の質が上がる仕組みです。

2. 総当たり批判フェーズ

専門家AIたちが出した結論を、互いに批判し合うフェーズを追加しました。「根拠が弱い」「前提が違う」と指摘させ、批判に耐えた結論だけを最終回答として採用します。

人間のチームでも「ちゃんと揉む」ほど精度が上がるのと同じ原理です。

v3の工夫──コストと精度のバランス

v2は精度が大きく上がりましたが、新しい問題が出てきました。

コストが高い。

批判フェーズで高性能なAIモデルを使うと、1回の処理コストが無視できなくなります。また、フィードバックループが無限に続くリスクも発覚しました(差し戻しを繰り返してループ地獄に入る)。

v3での対応は以下の3点です。

AIモデルの3段階使い分けを導入

AIには性能帯があります(詳細は後述)。すべての処理を最高性能モデルで回す必要はない。軽い会話処理は軽いモデルに任せ、高度な判断だけ高性能モデルを使う設計に変えました。

採点フェーズを早めた

以前は最後に採点していましたが、途中で採点することで「これ以上進める必要がない(品質十分)」と判断できるようにしました。

差し戻し上限を2回に固定

どんな仕事も「完璧」はありません。2回の改善で十分な品質になるよう基準を調整し、それ以上のループを切りました。

v4(確定版)──3段階モードと柔軟な設計

v4が現在の完成形です。追加した最大の改善はLite/Standard/Full の3段階モードです。

モード用途処理の重さ
Lite簡単な質問・メモ整理軽い
Standard通常の調査・分析中程度
Full重要な意思決定・深掘り調査重い

「全部の依頼に同じフローを通す必要はない」という、当たり前だけど実装を後回しにしていた設計です。

また、ヒアリングのスキップ機能も追加しました。依頼内容が明確なときに毎回質問されると煩わしい。「既にサマリーがあります」と判断したらスキップできるようにしました。

さらに、専門家AIの上書き機能。通常は自動で選ばれる専門家を、「この案件はこの専門家が必要」と手動で指定できる機能です。イレギュラーな依頼に対応できます。

設計したフロー全体像

最終的に完成したv4のフロー図です(処理の流れを簡略化して記載)。

'''

[フェーズ1] ヒアリング(軽量AI担当、スキップ可)

[フェーズ2] 依頼サマリー → Kei承認

[フェーズ3] モード選択(Lite/Standard/Full)→ Kei承認

[フェーズ4] タスク種別の判定 → 専門家AI選択 → Kei確認

[フェーズ5] 専門家AIが並列で実行(最大3回の修正ループ)

[フェーズ6] 第1ラウンド成果の共有

[フェーズ7] 総当たり批判 + チェックリスト採点

[フェーズ8] 事実確認(最高精度AI担当)

[フェーズ9] 最終報告(最高精度AI担当)

'''

フェーズ1〜3は「方向を合わせる」フェーズ。フェーズ4〜7は「質を高める」フェーズ。フェーズ8〜9は「正確にまとめる」フェーズと分けて考えると整理しやすいです。

要するに、AIが「聞く → 確認する → 実行する → 批判する → まとめる」の5ステップを自動で回してくれる状態です。人間がやることは各フェーズの承認だけ。

【各フェーズの詳細】

  1. ヒアリング: 依頼内容をAIが整理・確認する(軽量AI担当、内容が明確なときはスキップ可)
  2. 依頼サマリー確認: AIが依頼を要約し、Kei(人間)が方向性を承認する
  3. モード選択: Lite / Standard / Fullの処理モードを決定し、Keiが承認する
  4. 専門家AI選択: タスク種別を判定し、最適な専門家AIを選んでKeiが確認する
  5. 専門家AIの並列実行: 選ばれた専門家AIが作業実行(最大3回の修正ループ)
  6. 成果の共有: 第1ラウンドの結果を全AIが確認・共有する
  7. 総当たり批判 + 採点: 専門家AI同士が互いの成果を批判し、チェックリストで採点する
  8. 事実確認: 最高精度AI(Opus)が成果の正確性を検証する
  9. 最終報告: 最高精度AI(Opus)が結論をまとめてKeiに報告する

解決した5つの問題

実際にこの設計で解決できた問題を整理します。

問題1: コストが重い

軽量AI(Haiku)・標準AI(Sonnet)・高精度AI(Opus)の3段階モデルを役割に応じて使い分けることで解決。会話的なやりとりにOpusを使う必要はありません。

問題2: 方向がズレる

ヒアリング+サマリー承認フェーズを置き、「何をするか」を最初に確定させることで解決。途中で方向転換が起きにくくなりました。

問題3: 無限ループリスク

差し戻し上限を2回に固定することで解決。「2回直してダメなら、基準か依頼の設計に問題がある」と判断します。

問題4: 採点が甘くなる

「Yes/Noで答えられるチェックリスト5項目」を設けて採点します。主観ではなく基準で判断するため、評価がブレません。

問題5: 全依頼に重いフローを通してしまう

Lite/Standard/Full の選択制にすることで解決。軽い依頼に重いフローを当てていた非効率を排除しました。

AIモデルの使い分け──Haiku・Sonnet・Opusとは

ここで少し技術的な話をします。といっても、難しくはありません。

AIには「性能の段階」があります。Anthropicが提供するClaudeというAIでは、3つのモデルを使い分けます。

Haiku(ハイク)── 軽量・高速・低コスト

ヒアリングや整理など「会話的な処理」を担当します。速く、安く、シンプルなやりとりに向いています。重要な判断は苦手ですが、「まず情報を集める」用途なら十分です。

Sonnet(ソネット)── バランス型

分析、批判、採点などの「推論が必要な処理」を担当します。HaikuとOpusの中間で、精度とコストのバランスが最も取れています。チームの主力です。

Opus(オーパス)── 最高精度

事実確認と最終判断を担当します。最も高性能ですが、コストも高い。「ここは絶対に間違えてはいけない」という局面だけに使います。

人間チームで言えば、Haikuは「受付・アシスタント」、Sonnetは「各部門の担当者」、Opusは「最終決裁者」に相当します。

> [!tip]

> 日本でも2025年後半からAI活用の文脈は急速に変化しています。総務省「情報通信白書2025」によれば、国内企業のAI導入率は前年比で約2倍のペースで増加。このような「AIチームを設計する」発想は、近い将来、経営者の必須スキルになる可能性があります。

非エンジニアが「設計者」になれる時代

この記事を読んで「難しそう」と感じた方もいるかもしれません。でも正直に言うと、私はプログラミングがほとんどできません。

Claude Codeは、日本語で「こういう仕組みを作りたい」と伝えると、AIがコードを書いてくれます。設計の考え方さえあれば、実装はAIに任せることができます。

今回紹介したv1〜v4の進化も、すべて「うまくいかなかった理由を考え → 改善策を日本語で伝え → AIに実装してもらう」の繰り返しでした。

重要なのは技術スキルではなく、「どうすれば問題が解決するか」を考える設計思考です。これは経営者が最も得意とする領域ではないでしょうか。

AIが進化するほど、「AIに何をさせるか」を設計する人間の重要性は増します。プログラミングを学ぶよりも、AI設計の思考法を身につける方が、経営者には効果的だと私は考えています。

ただし、設計の失敗コストは実際にやってみて初めてわかります。v1〜v4のような試行錯誤を最短で飛ばすための支援が、Revival Asiaのコンサルティングです。

まとめ

今回の体験から得た教訓をまとめます。

  1. AIがズレるのは性能ではなく「設計」の問題が多い
  2. 1人のAIに全部頼むより、役割分担したチームの方が精度が高い
  3. ヒアリング → 承認 → 実行 → 批判 → 確定の流れが有効
  4. 「軽い処理に軽いモデル、重い判断に重いモデル」の使い分けがコスト削減の鍵
  5. 設計のアップデートは「失敗の観察」から始まる

Revival Asiaでは、エージェントチームの設計支援から運用サポートまで対応しています。「自社でも試してみたい」と思った方は、まずお気軽にご相談ください。

→ 無料AI診断はこちら(10問・即時スコアリング)

よくある質問(FAQ)

Q1. Claude Codeはプログラミングができないと使えませんか?

使えます。Claude Code自体はターミナル(黒い画面)で動きますが、「こういう仕組みを作りたい」と日本語で伝えるだけで、AIがコードを書いてくれます。設計の意図を言語化できれば、技術的な実装はAIに任せることができます。

Q2. エージェントチームを使うとコストはどれくらいかかりますか?

処理量(トークン数)とモデルの種類によります。今回の設計ではLite/Standard/Fullの3段階制を採用し、軽い処理にはHaikuを使うことでコストを抑えています。目安として、一般的な業務タスク1件あたり数十円〜数百円程度です(モードと処理内容による)。

Q3. エージェントチームは、どんな業務に向いていますか?

「調査 → 分析 → 提案 → レビュー」のような複数ステップが必要な業務に特に向いています。具体例:市場調査レポート作成、競合分析、営業提案書のドラフト、SEO記事制作、顧客対応マニュアル作成など。逆に、単発の質問回答やシンプルな文章生成には通常のチャットAIで十分です。

Q4. 一度設計したら、ずっとそのまま使えますか?

業務内容や使い方が変わるたびに改善が必要です。ただし「改善が必要な理由」はたいてい「うまくいかない体験」から見えてきます。v1→v2→v3→v4と進化させてきたように、小さな失敗を積み重ねながらブラッシュアップする運用が現実的です。

Q5. Revival Asiaでは、このエージェントチームをどう活用しているのですか?

現在は、記事制作・競合調査・サービス提案書作成・SEO/GEO監査など、複数の業務でエージェントチームを稼働させています。特に記事制作では「リサーチ担当 → ライター担当 → エディター担当」の3段階チームを使っており、1人での作業に比べて品質と速度が大幅に改善しました。この記事も、そのチームが制作しています。

関連記事

  • [[AI導入コンサルとは──中小企業が今すぐ始めるべき理由]]
  • [[SEO・GEOとは──AI検索時代に必要な2つの対策]]
  • [[Claude Codeとは──非エンジニアのための入門ガイド]]

> [!note]

> この記事はRevival Asiaが実際に運用しているエージェントチームで制作しました。AIと人間のコラボレーションによる記事制作の実験でもあります。ご質問・ご感想はお気軽にお問い合わせください。

RA

Kei(Revival Asia)

株式会社リバイバルアジア 代表取締役

元タンカー船航海士。プログラミング未経験から生成AIを独習し、中小企業200社以上の補助金申請とAI導入を支援。自社でAskNavi(AIチャットボット)・QuoteFlow(見積ツール)など複数のAIプロダクトを開発・運用中。「技術のためのAIではなく、経営のためのAI」が信条。

まず自社の状況を把握する

「コンサルが必要かどうか」の判断も、現状確認の後でOKです。
無料・5分・オンライン完結でお答えします。