
調査PRの企画立案をAIエージェント8名に任せてみた|Agent Teams活用事例
日本テレビの情報番組「ZIP!」がリサーチ機能をAIエージェントに行わせているというニュースがXなどで話題になりました。
広報業界にもAIの波が本格到来
番組のネタ探しから企画書作成までのフローをAIエージェントが担うというもので、いよいよ広報業界にも、AI浸透の波が本格的到来しています。
今回の記事では、Claude Codeの新機能として2026年2月に発表された「Agent Teams」を使い、広報・PR業務の主軸でもある「調査PR企画の立案」をAIエージェントチームに任せてみた実験をお伝えします。
目次[非表示]
- ・広報業界にもAIの波が本格到来
- ・Agent Teamsとは何か
- ・実験の設計:8人のAIエージェントチーム
- ・全体の流れ:85分間で何が起きたか
- ・衝撃的だった4つの場面
- ・1. 悪魔の代弁者が最初に「やってはいけないことリスト」を作った(Phase 1・ステップ1)
- ・2. 記者がPR側の自信作を「広告でしょ」と一蹴した(Phase 1・ステップ3)
- ・3. 悪魔の代弁者がチームの総意に「NO GO」を突きつけた(Phase 2・ステップ6)
- ・4. 記者が調査設計そのものを作り変えた(Phase 2・ステップ6)
- ・最終的に出てきた成果物
- ・Agent Teamsの運用で学んだこと
- ・コストの現実と、AIモデル間の品質差
- ・広がるAI格差:使う側と使わない側
企画やアイディアといったものは、考える時間(いわゆるシンキングタイム)に比例して質が上がるものです。人間のPRチームなら、クライアントの業界調査から始まり、テーマの発散・収束、リスク検討、記者の反応予測まで、数日から数週間をかけて企画会議を繰り返します。
今回、AIエージェント8名がこの全工程を85分かけて実行し、うち54分をエージェント同士のディベートに費やしてくれました。
その結果がかなり衝撃的だったので、詳しくお伝えします。
Agent Teamsとは何か
まず前提を簡単に。Agent Teamsは、複数のAIエージェントにそれぞれ異なる役割を与え、チームとして協働させるClaude Codeの新機能です。
従来の「サブエージェント」(1つのAIが部分タスクを別のAIに委任する方式)とは根本的に異なります。Agent Teamsでは、各エージェントが独自の立場・判断基準・記憶を持ち、他のエージェントの出力に対して「反対」や「修正要求」ができるのです。
今回はこのAgent Teamsで、調査PR企画立案システムを実装・テストしました。
「PR会社の企画会議をAIで再現する」というコンセプトで、作る側(PR側)と評価する側(記者側)を分離し、ダメ出しのループを回すことで企画の質を高める仕組みです。
Windows環境では違いが分かりにくい
ちなみにAgent Teamsは本来、tmux(ターミナルの分割・多重化ツール)を使うと複数のエージェントが並列で動いている様子をリアルタイムに見られるのですが、Windowsではtmuxが使えません。ターミナル上では1画面で順次処理されているように見えるため、「8人が同時に議論している」感が薄れてしまうのがちょっと残念です。裏ではちゃんと並列で動いているようですが見た目の「エージェント感」はMac/Linux勢に軍配が上がります。
実験の設計:8人のAIエージェントチーム
まずAgent Teams機能をオンにします。
これはClaude Codeにオフィシャルリンク(https://code.claude.com/docs/ja/agent-teams )を添えて直接依頼するのが簡単です。{"env": {"CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"}}
そしてプロジェクトの根幹となるCLAUDE.md(Claude Codeがセッション開始時に自動で読み込む設定ファイル)に、以下のような内容をまとめて記載しておきます。
- チームの構成(誰が何人いるか)
- 各エージェントの役割・人格・口癖・行動原則
- ワークフロー(Phase 1→2→3の流れと各ステップの内容)
- 記者チームのプリセット定義
- ファイル保存ルール、品質チェック基準
Claude Codeを起動すると、PRマネージャーがこのCLAUDE.mdを読み込み、書かれたワークフローに沿って自律的にチームを動かし始めます。人間がやるのは「クライアント情報を入力する」だけ。あとはマネージャーが段取りを組み、エージェントを起動し、記者にフィードバックを求め、成果物を保存するところまで全て自動で進みます。
チーム構成
今回以下のようなチーム編成にしてみました。記者側の設定は弊社の無料リリース改善ツール「プレスナビ」からそのまま流用しています。
作る側(PR側チーム 4名):
役割 | 特徴 |
|---|---|
PRプランナー | 「一言で言うと何が面白い?」が口癖。切り口を作る人 |
リサーチャー | 「エビデンスあります?」が口癖。データの番人 |
メディアリレーション | 元記者目線。「自分が記者なら記事にするか?」で考える人 |
悪魔の代弁者 | 「それ、Xで燃えたらどうする?」が口癖。全企画にケチをつける人 |
評価する側(記者チーム 3名):
記者の候補としては、弊社広報DXツール「プレスナビ」より、5名の記者ペルソナをそのまま流用しています。
記者チームはマネージャーがその中から選出。今回はPR目的が「社会的信用の回復・世論の転換」であるため、社会課題型プリセットが適用され以下の3名が選ばれました。
役割 | 判断基準 |
|---|---|
田中厳一(経済紙) | 数字で語れ。ポジショントークは記事にしない |
佐藤優子(生活部) | 当事者の顔が見えるか。「うちもそうだ」と思えるか |
山田映介(TV) | 映像になるか。お茶の間のおばちゃんがわかるか |
マネージャー 1名: 自分では作らず、指示と最終判断に専念する統括者。
PR側が企画を作り、記者がダメ出しし、修正して、また評価される。このループを3フェーズ繰り返す設計です。
クライアント設定
今回調査PRの実験企画として、試しに何かと炎上にことかかない「電動キックボード」をテーマとしてチョイスしてみました。

電動キックボードの事故・違反・マナー問題でSNS批判が絶えない某ブランドの起死回生策として、調査PRを打つとしたらどんな企画が良いか、AI同士で徹底的に討論させるという趣旨です。
入力データは以下だけです。
企業名: ▓▓▓▓
業種: シェアリングモビリティ
PR目的: 調査PRによる社会的信用の回復・世論の転換全体の流れ:85分間で何が起きたか
クライアント情報を受け取ったPRマネージャーが、最初に自分で作成したタスクリストがこちらです。

この8ステップが、85分間で順番に実行されました。全体像を先にお見せします。
Phase 1:テーマの探索 — 約30分
ステップ1. PR側4エージェントが並列でテーマ提案(各5テーマ)
4人が同時に動き出します。それぞれの担当領域はこちら。

Web検索で業界動向・批判状況・政府統計を調べた上で、合計20テーマを提案。悪魔の代弁者はこの段階でテーマ提案ではなく「やってはいけないことリスト」の作成を自発的に開始しました。
4人の提案が出揃うと、マネージャーが全エージェントの提案をクロスマッピングします。

注目すべきは右端の「悪魔の代弁者」列。テーマごとに安全/注意/危険のリスク判定を出しています。「マナー批判構造」は炎上リスク大、「違反者プロファイリング」も炎上リスク大——これらは次のステップで除外されます。
ステップ2. マネージャーが5テーマに絞り込み+PR側ディベート
悪魔の代弁者の危険フラグを尊重し、炎上リスクの高いテーマを除外。残った中からマネージャーが5テーマを選定しました。

この5テーマを記者チームに提示します。
ステップ3. 記者チーム3名にフィードバック依頼
5テーマを記者3人に提示。「これ、記事にしますか?」と記事化確率を聞く。ここで大きな温度差が発覚。
ステップ4. 記者FBを受けてPR側再ディベート→3テーマ確定
記者の評価を踏まえてPR側が再議論。記者評価の高い3テーマに絞り込み。
ステップ5. 成果物ファイル保存
Phase 1の全成果物(テーマ提案、リスク環境レポート、記者FB統合)を即時保存。
Phase 2:仮説構築— 約20分
ステップ6. 仮説構築→1テーマ確定
3テーマそれぞれの仮説を構築し、再度記者に評価を依頼。ここで悪魔の代弁者がNO GOを出す最大の対立が発生。マネージャーが条件付きで解除し、最終1テーマに確定。
Phase 2.5:準備 — 約5分
ステップ7. 基準値シート作成
Phase 3で4エージェントが並列作業する際の「共通前提」をマネージャーが作成。N数・割付・スケジュール・費用等の数値を1ファイルに確定。(これがないと、並列実行時にエージェント間で数字がバラバラになる——後述の「問題点」参照)
Phase 3:具体化(調査設計の確定)— 約30分
ステップ8. 調査設計の確定・成果物作成
PR側4エージェントが並列で成果物を一斉作成。リサーチャーは調査設計書・調査票・クロス集計、PRプランナーは企画書・ストーリーシナリオ・Q&A、メディアリレーションはメディア戦略、悪魔の代弁者はリスクレポート・ネガティブQ&A。最後に記者3名が最終判定。
💡ポイントは「一直線に進んでいない」こと
Phase 1で記者のダメ出しを受けてPR側が再議論し、Phase 2で悪魔の代弁者の反対をマネージャーが条件に変換し、Phase 2.5で共通前提を整えてからPhase 3に進む。行きつ戻りつしながら企画が研ぎ澄まされていくプロセスが、85分の中に凝縮されています。
では、この流れの中で特に衝撃的だった場面を4つ紹介します。
衝撃的だった4つの場面
1. 悪魔の代弁者が最初に「やってはいけないことリスト」を作った(Phase 1・ステップ1)
他の3人が「こんなテーマはどうか」と提案を始める中、悪魔の代弁者だけが最初にやったのは「このブランドが絶対にやってはいけないこと」のリスト作成でした。
「事故423件、違反検挙48,376件、死者1人。台数23,220台で割ると1台あたり年2回以上検挙。この状況で"安全です"は通らない。」
SNS世論の3層構造分析、炎上パターンの類型化、「やってはいけない5方向」の明確化まで自発的に行い、このリストが以降の全議論のガードレールになりました。
「まず何がダメかを徹底的に洗い出してから、安全地帯で企画を考える」——この順序はPR実務でも理想的ですが、指示なしで自発的にやったことに驚きました。
2. 記者がPR側の自信作を「広告でしょ」と一蹴した(Phase 1・ステップ3)
PR側が推していた「非利用者との共存意識調査」に対して、経済部の田中記者が記事化確率15%を出しました。
「企業の火消しPRでしょ。規制当局が出すべきデータ。記事にしない。」
一方、記者全員が高評価をつけたのは「免許返納後の移動実態調査」(平均80%)。PR側が面白いと思ったものは記者には「広告」で、PR側が地味と感じたテーマが記者には「王道」だった。
この温度差をPhase 1の段階で検知できたのは非常に大きかったです。人間のPR会議でも「記者に見せたらこう言われた」は後工程で初めて分かることが多いのですが、このシステムでは企画の初期段階でフィードバックが返ってきます。
3. 悪魔の代弁者がチームの総意に「NO GO」を突きつけた(Phase 2・ステップ6)
テーマが「免許返納」に決まりかけた時、悪魔の代弁者だけが反対しました。
「電動キックボードの会社が"高齢者の移動問題"を語る? 世間は"高齢者にキックボードに乗れと言うのか"と解釈する。炎上確実だ。」
PRプランナー、リサーチャー、メディアリレーション、記者3人全員がGO。その中での単独反対です。
マネージャーはこの反対を潰さず、「指摘は正しい。でも解決できる」と判断し、6つの設計条件に変換しました。「電動キックボードに一切触れない」「大学との共同調査にする」「不都合な結果も全て公表」等——悪魔の代弁者の「反対」が企画を止めるのではなく、企画を安全にする材料に変わった瞬間でした。
4. 記者が調査設計そのものを作り変えた(Phase 2・ステップ6)
記者からの3つの要求が、PR側の原案にはなかった設計変更を生みました。
「家族を調べろ」(佐藤記者・生活部) → 家族群500人が追加。N=1,000 → N=1,500に。
「隠れ運転を聞け」(全員) → 「返納したのに実はまだ運転している人がいるのでは?」という仮説が追加。山田(経済番組ディレクター)は「これが出たら記事化確率95%」と断言。
「大学名を前に出せ」(田中記者・経済紙) → 「"▓▓▓▓調べ"の6文字が入った瞬間、読者は"あの電動キックボードの会社が"と思う」。調査クレジットは大学名が先頭に。
これら全てPR側チームの原案にはなかった要素です。特に「隠れ運転」がこの調査の最大のニュースフックになったのですが、これは記者エージェントがいなければ生まれなかった仮説でした。
最終的に出てきた成果物
数字で見る結果
項目 | 値 |
|---|---|
コスト | $45.56(約6,800円) |
所要時間 | 85分 |
総トークン数 | 約4,558万トークン |
生成ファイル | 18ファイル |
記者最終判定 | 全員GO(75%/90%/85%) |
成果物の中身
- 調査設計書(調査会社にそのまま発注できるレベル。N=1,500、3群構成)
- 調査票ドラフト(全36問、全設問に「なぜこの設問が必要か」の注釈付き)
- クロス集計設計(約240テーブル)
- 調査PR企画書(クライアント提案用)
- 想定結果シナリオ(3パターン。どの結果が出てもニュースになる設計)
- メディア戦略(21媒体のA/B/Cランク分類+キャラバン計画)
- リスク評価レポート(炎上シナリオ3パターン+初動対応マニュアル)
- 想定Q&A(通常30問+ネガティブ8問+SNS対応5パターン)
相当な85分ぶっ続けで動いていたので約5000万トークンにも及ぶ相当なトークン数となりました。
MAXプランのユーザーしか使うのが憚られるコスト感ですが、逆にMAXプランでこれが使い放題であれば、かなり差別化ができるのではないでしょうか。
Agent Teamsの運用で学んだこと
さてこのAgent Teamsは、実務に使えるのでしょうか。
特に以前紹介したサブエージェントを記者に見立てた手法との違いはなんなのでしょうか。
ここまでで分かったことをまとめてみたいと思います。
うまくいったことやポイント
ペルソナ設計の威力
「あなたはPRプランナーです」だけでは弱いです。口癖(「Xで燃えたらどうする?」)・行動原則(出典のない数字は使わない)・評価基準(何を見てGO/NO GOを判断するか)まで定義すると、出力の質が劇的に変わることが分かりました。
悪魔の代弁者はSNS炎上シミュレーションを自発的に作成し、リサーチャーは出典のない主張を自ら排除する行動が出ました。
「作る人」と「評価する人」の分離
記者スコアがPhase 1: 67% → Phase 2: 73% → Phase 3: 83%と改善。フィードバックループの効果が数字に出ました。
悪魔の代弁者への「特権」付与
リスクフラグに強制力を持たせ、「フラグが立ったらマネージャーが必ず対処してから進む」ルールにしたのが効きました。特権がないと他のエージェントに無視されるパターンがありました。
即時ファイル保存ルール
なんせ使うトークン数が多いもので、セッション中にコンテキスト圧縮が2回発生しましたが、プロセスごとにファイル出力をマストとすることで、成果物は一切消失しませんでした。
問題点と対策
Allow設定を考える良いきっかけ
Agent Teamsでは8人のエージェントがファイル作成やWeb検索を大量に行います。
Claude Codeの「Allow」設定(どのツール実行を自動許可するか)を事前にきちんと設計しないと、毎回確認ダイアログが出て終わりません。
逆に言えば、「何を自動で許可し、何に人間の確認を挟むか」を考えること自体が、AIとの協働における設計力の訓練になると言えるでしょう。
コストの現実と、AIモデル間の品質差
約6,800円。人間のPRチームが同じ工程を回せば数日〜数週間分の人件費がかかることを考えれば破格ですが、「AIに聞いただけ」にしては高い、と感じる方もいるかもしれません。
実際、今回のシステムはClaude Opus 4.6(最上位モデル)をベースにしています。企画の質を比較すると、現時点では以下のような体感差があります。
1位:Claude Agent Teams(Opus 4.6ベース)
2位:GPT 5.2 Pro
~ アイディアと品質の壁 ~
Claude 4.6 / Gemini 3 Pro / GPT 5.2
やはり時間をかけたほうがより深いアイディアが出てくる印象です。
広がるAI格差:使う側と使わない側
今回のAgent Teamsの登場で、以前にも増してAI格差が言及されるケースが増えてきたように思えます。
今回の実験を通じて最も強く感じたのは、AIを「使う人」と「使わない人」の間に、決定的な格差が生まれつつあるということです。
85分で18ファイルの成果物が出るということは、「AIを使うPRプランナー」は「使わないPRプランナー」に比べて、企画の初速が圧倒的に速いということです。
もちろんAIの出力をそのまま使うわけではありませんが、たたき台の精度がここまで上がると、人間の仕事は「ゼロから考える」から「AIの出力を磨き上げる」にシフトしていきます。
今回の実験コンセプトも、まさにそこにあります。
AIがPR会社を代替するのではなく、企画会議の「初速」をAIで加速し、人間のPRプランナーが磨き上げる。この組み合わせが、これからの広報業務のスタンダードになっていくのではないでしょうか。
今回のAgent teamsにも似た構造を持たせているのが、記者エージェントがプレスリリースを様々な視点から分析・改善する広報DXツール「プレスナビ」です。
無料で使えますので、この機会にAIの力を是非ご体験ください。



