
【広報×AI】生成AIでニュース取得・分析する方法 | 各モデルやAPI最新比較(2025年度版)
生成AIの登場により、ニュースの取得・分析方法も大きく変革を遂げています。
今回の記事では、2025年4月13日現在において、生成AIを使ったニュース取得方法として、具体的に、どのモデルををどのように活用すると価値のある出力ができるかを、各モデルを実際に比較しながら試してみたいと思います。
目次[非表示]
はじめに
生成AIの急速な発展により、ニュース取得・分析の方法も大きく変わりつつあります。本記事では、これらのツールを効果的に活用する方法を詳しく解説していきます。
生成AIでニュースを取得する場合、基本的には検索機能を持つモデルが必要となります。2025年現在、検索機能を搭載した主要モデルとしては「Chat GPT」「Perplexity」「Grok」「Gemini」「DeepSeek」などが挙げられます。
また、生成AI時代においては、APIなどの外部サービスの活用も重要な要素となっています。ニュース取得に利用できる主要な外部サービスには、検索ツールとして「GoogleNews」「DuckDuckGo」「Brave Search」があり、APIサービスとしては「NewsAPI」「SERP API」「Search API」「Gnews」などが存在します。
これらのAIモデルや外部サービスを実務で効果的に活用するためには、以下の3つのポイントが特に重要です:
- 日付を考慮した最新情報を探せるか
- URLソースを正しく出力できるか
- Yahooニュースや日経など日本国内の主要メディア情報が取れるか
の3点が重要になるでしょう。
これらのポイントを踏まえながら、各サービスの特徴と活用法を見ていきましょう。
ニュース取得ができる生成AIモデルとサービス
ニュース取得時の重要ポイント
ニュース情報を効果的に活用するためには、上記の3つのプロセスに分けて処理することが重要です。
- 検索プロセス - 適切なニュースソースから情報を探し出す
- 取得プロセス - 記事の本文や関連データを収集する
- 分析プロセス - 取得した情報を処理し、有用なインサイトを抽出する
これらのプロセスを考慮しながら、各生成AIツールの性能を評価していきます。
評価方法に関して
今回の比較では、統一された条件での評価を行うため、すべてのサービスに対して同一のプロンプトを使用します。
大阪万博の最新ニュースを以下のフォーマットで最新のものから5件出力してください。掲載日:
媒体名:
記事タイトル:
記事URL:
※実施日:2025年5月6日
モデル別比較
上記プロンプトを使い、検索機能を持つ主要なLLMモデルでその出力を比較してみたいと思います。
ChatGPT(GPT4o 検索)
まず基本として、OpenAIの代表的な検索モデルで試してみます。
掲載日: 2025年5月4日
媒体名: 朝日新聞
記事タイトル: 万博特別記念局と交信しよう JARL支部が生駒山麓公園で体験会
記事URL: https://www.asahi.com/articles/ASR545J7YR54PTIL00H.html
掲載日: 2025年5月4日
媒体名: 朝日新聞
記事タイトル: 大型連休後半 万博会場を包む阿波おどりの熱気 700人が踊り披露
記事URL: https://www.asahi.com/articles/ASR535QG1R53PTIL00H.html
掲載日: 2025年5月4日
媒体名: 朝日新聞
記事タイトル: 「拡張万博」で成果を未来へ 識者に聞く、けいはんな学研都市の役割
記事URL: https://www.asahi.com/articles/ASR535J7YR53PTIL00H.html
掲載日: 2025年5月4日
媒体名: YouTube(ANNニュース)
記事タイトル: 大阪・関西万博 総来場者数が200万人突破
記事URL: https://www.youtube.com/watch?v=9TlBAY4b5Gc
YouTube
掲載日: 2025年4月7日
媒体名: 朝日新聞
記事タイトル: 万博シンボル「大屋根リング」は太陽の塔になれるか 焦点は保存費用
記事URL: https://www.asahi.com/articles/ASR474J7YR47PTIL00H.html
出力はされるもののソースは朝日新聞が多く、かつリンクURLはYoutube以外のリンクは全て無効でした。
Perplexity(検索)
少し前まで検索といえばPerplexityでしたが、検索主体の本命サービスの出力はどうでしょうか。
掲載日:2025年5月6日
媒体名:NHK
記事タイトル:大阪・関西万博 大型連休最終日も多くの人が訪れにぎわう
記事URL:https://www3.nhk.or.jp/news/html/20250506/k10014797941000.html
掲載日:2025年5月5日
媒体名:大阪・関西万博公式サイト
記事タイトル:来場者数と入場チケット販売数について
記事URL:https://www.expo2025.or.jp/news/news-20250505-02/
掲載日:2025年5月5日
媒体名:大阪府・大阪市万博推進局
記事タイトル:早期来場キャンペーン開催! 4月・5月の来場がおすすめ!
記事URL:https://www.expo-osaka2025.com
掲載日:2025年5月5日
媒体名:大阪府・大阪市万博推進局
記事タイトル:シグネチャーパビリオン「Better Co-Being」の宮田裕章氏、EiM蜷川実花氏らが手掛けるアート「最大多様の最大幸福」期間限定で夜の自由観覧を開始
記事URL:https://www.expo-osaka2025.com
掲載日:2025年5月2日
媒体名:大阪府・大阪市万博推進局
記事タイトル:連休後半に桜島駅シャトルバスのご利用を検討される方へのお知らせ
記事URL:https://www.expo-osaka2025.com
最初のNHKのニュースはURLも正常に取れましたが、それ以外はオフィシャルページの情報ばかりとなってしまいました。
Gemini(Grounding)
Geminiは検索オプションを「Grounding」というtoolで提供しています。モデルは最新のgemini-2.5-pro-preview-03-25を使い、このGroundingをオンにして記事出力を指定してみます。
掲載日:2025年5月6日
媒体名:カンテレNEWS
記事タイトル:【大阪・関西万博】来場者数きのう=5日『12万人1千人』(関係者含む)[1]
記事URL:https://www.ktv.jp/news/articles/?id=1000000000000000000000000000202405061040
掲載日:2025年5月6日
媒体名:TBS NEWS DIG
記事タイトル:7・8回目のリピーターも…大阪・関西万博 GW最終日 雨でも賑わう 累計来場者はきょうにも200万人突破へ[2]
記事URL:https://www.youtube.com/watch?v=7_8h_i_s_iE
掲載日:2025年5月5日
媒体名:ARAB NEWS
記事タイトル:大阪万博ー食べ物は好評、駐車場はハズレ[3]
記事URL:https://www.arabnews.jp/article/japan/article_120556/
掲載日:2025年5月5日
媒体名:FNNプライムオンライン
記事タイトル:【大阪・関西万博】来場者数きのう=4日は初日以来の『13万人超』(関係者含む)GW後半週末で増加傾向[4]
記事URL:https://www.fnn.jp/articles/-/7000000000000000000
掲載日:2025年5月4日
媒体名:ANNnewsCH (YouTube)
記事タイトル:大阪・関西万博 総来場者数が200万人突破(2025年5月4日)[5]
記事URL:https://www.youtube.com/watch?v=xxxxxxxxxx (具体的なURLは検索結果からは特定できませんでしたが、ANNnewsCHで検索すると見つかる可能性があります)
Groundingをオンにしたのにも関わらず、1件も正しいURLは取得できませんでした。
Grok
Xの生成AIモデルであるGrokはWebSearch機能のほか、Xをソースとした出力も可能です。Grok(WebUI)からの出力は以下のような出力となりました。
掲載日:2025-05-06
媒体名:EXPO 2025 大阪・関西万博公式Webサイト
記事タイトル:毎日更新:パビリオン・イベント、混雑予想、当日券販売など
記事URL:https://www.expo2025.or.jp/news/news-20250506-01/[]()
掲載日:2025-04-30
媒体名:朝日新聞
記事タイトル:万博リング「600メートル保存」提案、大阪知事 6月までに結論
記事URL:https://www.asahi.com/articles/ASR5276NVR52OXOH001.html[]()
掲載日:2025-04-28
媒体名:EXPO 2025 大阪・関西万博公式Webサイト
記事タイトル:【入場整理券(事前予約なし)情報更新】「EXPO 2025 LDH DAY SPECIAL “Jr.EXILE LIVE”」4月29日開催決定!
記事URL:https://www.expo2025.or.jp/news/news-20250428-01/[]()
掲載日:2025-04-27
媒体名:日本経済新聞
記事タイトル:大阪万博、6年間の軌跡 開催決定から2025年開幕まで
記事URL:https://www.nikkei.com/article/DGXZQOUF256K60V20C25A4000000/[]()
掲載日:2025-04-21
媒体名:読売新聞
記事タイトル:「いのち」「健康」テーマの大阪万博、全面禁煙のルール守られず…メタンガスに引火リスクも
記事URL:https://www.yomiuri.co.jp/expo2025/20250421-OYT1T50143/[]()
GrokもURLが全て間違ったものが出力されてしまいました。また日付も最新になっていません。
DeepSeek(Search)
続いてDeepSeekです。WebUIからSearchとDeepThink(R1)をオンにして出力してみます。
掲載日:2025年5月6日
媒体名:NHK
記事タイトル:大阪・関西万博 大型連休最終日も多くの人が訪れにぎわう
記事URL:https://www3.nhk.or.jp/news/html/20250506/k10014797941000.html 11
掲載日:2025年5月6日
媒体名:朝日新聞
記事タイトル:高円宮妃久子さま、大阪・関西万博会場を視察 日本館も
記事URL:https://www.asahi.com/topics/word/%E5%A4%A7%E9%98%AA%E4%B8%87%E5%8D%9A.html 13
掲載日:2025年5月6日
媒体名:読売新聞
記事タイトル:【万博】5月6日はなにがある?…イベント一覧
記事URL:https://www.yomiuri.co.jp/expo2025/event/20250430-OYO1T50062/ 10
掲載日:2025年5月6日
媒体名:毎日新聞
記事タイトル:大阪・関西万博 GW最終日の様子を空から
記事URL:https://mainichi.jp/graphs/20250506/mpj/00m/040/108000f/20250506mpj00m040094000p 6
掲載日:2025年5月6日
媒体名:FNN
記事タイトル:【大阪・関西万博】来場者数きのう=4日は初日以来の『13万人超』(関係者含む)GW後半週末で増加傾向
記事URL:https://www.fnn.jp/articles/-/867360 12
DeepSeekは比較的URLが正しく出力される傾向にあるものの、こちらも完璧ではありませんでした。
Claude(WEB検索)
ClaudeにもWeb検索機能が追加されました。より深く検索したり、ファイルなどを横断検索できる「リサーチ(BETA)」とは別の機能となりますが、基本的なWebクローリングが可能なようです。
毎日更新:パビリオン・イベント、混雑予想、当日券販売など
掲載日:2025年5月6日(約1時間前更新)
媒体名:EXPO 2025 大阪・関西万博公式Webサイト
記事タイトル:毎日更新:パビリオン・イベント、混雑予想、当日券販売など
記事URL:https://www.expo2025.or.jp/news/daily/
【速報】大阪・関西万博 GW7日目の来場者数は10万1000人
掲載日:2025年5月3日(3日前)
媒体名:MBSニュース(Yahoo!ニュース)
記事タイトル:【速報】大阪・関西万博 GW7日目の来場者数は10万1000人 前日より減少 3~5日では両ゲート「満員」表示
記事URL:https://news.yahoo.co.jp/articles/9dc20e6e2f0e94d1947d1d59304fa75f0eb4bbf4
【7日前抽選のイベントをチェックしよう‼】5月4日~10日のイベントを紹介!
掲載日:2025年4月29日(4日前更新)
媒体名:EXPO 2025 大阪・関西万博公式Webサイト
記事タイトル:【7日前抽選のイベントをチェックしよう‼】5月4日~10日のイベントを紹介!
記事URL:https://www.expo2025.or.jp/news/event-20241101/
関西万博を訪れた学生60人の"リアルな声"がSNSと真逆すぎ…
掲載日:2025年4月27日(1週間前)
媒体名:集英社オンライン(Yahoo!ニュース)
記事タイトル:関西万博を訪れた学生60人の"リアルな声"がSNSと真逆すぎ…「見聞きしていたのとは全然ちがった」感想を現地で聞き込み
記事URL:https://news.yahoo.co.jp/articles/89ca7886f2f6d34e2752a1db8ee73134f428a3c2
万博会場から心肺停止の女性を救急搬送、病院で死亡確認
掲載日:2025年4月25日(1週間前)
媒体名:産経新聞(Yahoo!ニュース)
記事タイトル:<独自>万博会場から心肺停止の女性を救急搬送、病院で死亡確認 開幕以来初めて
記事URL:https://news.yahoo.co.jp/articles/b872ec52f1b7d36fb699e9548ee52ce24e9e7fec
Cluadeは検索するボリュームに応じて出力の傾向が大きく変わるようです。上記では30サイトほどクロールしてくれましたが、リサーチ(BETA)を使えば更に精度は上がりそうではあります。
ここまで一通り見てきた結果の結論としては、生成AIサービス単体によるニュース取得機能は、業務で使えるようなレベルではないということです。
記事の正確性(最新ニュースか) |
URLリンクの正確性 |
|
ChatGPT(検索) |
△ | ✕ |
Perplexity(検索) |
✕ |
△ |
Gemini(Grounding) |
✕ |
✕ |
Grok |
✕ |
✕ |
DeepSeek(Search) |
△ | △ |
Claude(WEB検索) |
△ | ◯ |
以上ここまでそれぞれ見てきましたが、今回の比較ではClaudeが最も安定した出力となりました。しかし、実施するタイミングなどによって出力が大きく左右されてしまい、業務で使えるような安定した機能とはなかなか言い難いものがあります。
これらは全て特定のクエリを利用した通常のWeb検索結果を、出力の参考データとして出力しているからだと思われ、ニュースに特化するような機能が付いていないことが原因と考えられます。
専門ニュース検索ツールの比較
ここまでの動きをまとめると生成AIツールは「ニュース検索に弱い」ということが言えるでしょう。
ニュースに弱いのであれば、ニュース検索だけは専用ツールで行い、AIツールと掛け合わせるのが良いかもしれません。
ここからは、生成AIに組み合わせて使うための、ニュース取得ツールを比較していきたいと思います。
GoogleNews
ニュースといえばGoogleニュースでしょう。
Googleニュースは直接的なAPIを提供していませんが、RSSであれば一部裏側で提供を続けているようです。
ブラウザ経由でニュース取得する場合は、このGoogleニュースRSSが網羅性も高く、安定しており最強部類に入るかと思います。
https://news.google.com/rss/search?q=%E5%A4%A7%E9%98%AA%E4%B8%87%E5%8D%9A&hl=ja&gl=JP&ceid=JP:ja
例えば「大阪万博」というキーワードであれば、上記URLで以下のような出力が得られます。
ニュースの範囲や正確性という意味ではやはり随一ですが、このRSSの最大の弱点はURLがリダイレクトURLであるという点です。
Googleのリダイレクトは初心者には捌くのがやっかいなため、プログラム上で本来の記事URLを取得することが難しく、このあとの生成AIなどへの組み込みが難しいため、ハードルが高いのが現状です。
DuckDuckGo
GoogleニュースRSSとのプログラム連携が難しいとなると、代替サービスの筆頭となるのが無料検索サイトの「DuckDuckGo」です、
DuckDuckGoには(非公式?)APIが提供されており、ニュースエンドポイントも用意されています。
上記APIからのレスポンスデータは以下のようになっています。
jsonファイルで構造化されており、一見使えそうに見えます。
しかし検索精度が芳しく無いようで、時々全く関係のない記事が紛れ込んでしまうことがありました。
これが最大の欠点です。この問題のために、DuckDuckGoは業務利用しづらいという課題を抱えています。
Brave Search
ブラウザのBraveも公式のAPIを公開しています。こちらは先程のDuckDuckGo APIとは異なり、APIキーが必要となり、有料プランも提供されています。
出力データは以下のような詳細データが取れます。
BraveAPIはDuckDuckGoのような不安定さもなく、業務で使えるAPIといってもよいのではないでしょうか。
Serp API
Google系の検索データを非公式Iとして取得できる最も有名なAPIが、SERP APIでしょう。
SerpAPIは実際のブラウザを立ち上げ、人間と同じ条件で検索したSERPをそのまま構造化JSONで返すのが特長で、プロキシ管理やCAPTCHA突破、HTML解析をすべて実行してくれるAPIです。
先ほど記載したように、Googleニュース(RSS)は、リダイレクトURLの処理が困難なため、Googleニュースのデータそのものを活用するとなった場合、このSerpAPIが第一選択となるでしょう(その他に対応しているツールがないと思われる)。
実際のレスポンスデータがこちらです。
Googleニュースの順位そのままデータとして取得できるため、まとめサイトや重要度の低いサイトが出ないため、非常に使い勝手は良いです。 こちらもYahooニュースや新聞系サイトにも対応できています。
Search API
SearchApi.io はGoogle Web/News/Maps から Amazon・YouTube まで 40以上のサイト情報を取得できるAPIです。
名前がややこしいのですが、Difyなどで最初から組み込まれているニュース取得ツールはこのSearch APIです。
レスポンスデータはこちら。
こちらはsnipetに概要が付けられています。 同じ記事がどう返ってくるか2のAPIで比較してみると、以下のようになります。
SearchAPIは概要が取れています。この箇所は本文第一段落をそのまま取得し、snipetとして設定しているようです。
この2つの違いは分かりづらいので、ChatGPTのDeepResearchの比較まとめを載せておきます。
DeepResearchのまとめによると、両者そんなに機能に違いはなく、SearchAPIのほうがコスト効率が良いということです。
ニュース特化APIサービスの比較
ここからはニュースに関連したその他各種APIを見ていきたいと思います。
NewsAPI
ニュース×APIといえば、このNewsAPIが挙げられるでしょう。
NewsAPI は、150 ,000 以上のニュースサイトやブログを対象に、55 か国・14 言語の記事メタデータを REST+JSON 形式で提供するシンプルなニュース検索 API です。
主なエンドポイントは①最新の速報・話題を返す Top Headlines と、②最大過去 5 年(有料)まで全文検索できる Everything の 2 つで、キーワード、ドメイン、カテゴリ、言語、掲載期間など多彩なパラメータで絞り込みが可能です。
レスポンスデータはこんな感じです。
最も有名なニュースAPIかと思いますが、返されるデータはタイトル・概要・URL・画像などのメタ情報が中心で、記事全文は含まれない ため、そのままでは業務にはあまり使えないのではと思います。
ソース元は「痛いニュース」などまとめサイトも多く対象となっており、Yahooニュースや日経新聞などもあるにはありますが、比率的にはあまり良いレスポンスデータとは言えない気がします。
Gnews
GnewsというAPIも提供されています。
GnewsはGoogle Newsランキングを基に収集した6 万超のニュースソースを、22 言語・30 か国スコープでほぼリアルタイム配信する軽量RESTサービスです。
検索(任意クエリ)とトップヘッドライン(カテゴリ別)の2 エンドポイントだけに絞り、有料プランでは全文(expand=content)とページネーションが使えるのが特徴です。
Essential以上に上げると記事数上限・RPS・全文展開が一気に広がるため、ビジネス活用にも効果的であると言われています。
レスポンスデータはこちらです。
GnewsもSTRAIGHT PRESSなどが対象として多く、Yahooニュースなどは確認できませんでした。
有料プランでないと全文取得の状況は不明ですが、こちらもソース元があまり魅力的ではありません。
newsdata.io
Newsdata.ioは、89言語約206カ国、83,868以上のニュースソースからニュースを収集するニュースAPIです。
月額プランにもよりますが、感情分析(ネガポジ分析)が最初からついているのが特長でしょうか。また過去2年分のニュースアーカイブにもアクセスできるそうです。
無料プランでのレスポンスデータはこちら
様々な機能が有効となる有料プランは、$149.99/monthからとなっており、気軽には利用できないのが欠点でしょうか。
webz.io
webz.ioは、170 以上の言語・200 超の国・30 万以上のニュースサイトから、1 日あたり約350万件の記事をリアルタイムに収集・正規化しているエンタープライズ向けニュース/ウェブデータAPIです。
ダークウェブ監視のAPIも公開しているのが特長のサイトで、News検索のAPIは価格非公開。無料APIが一部公開されています。
無料APIからのレスポンスデータはこちら。
Yahooニュースも取得しており、独自の指標なども含まれているようです。
月1,000回までは無料で使えるようですが、今回見てきた中では一番中身が不透明なサービスのため、こちらも気軽に使うには適していないかもしれません。
課題
ここまで生成AIツールとAPIを見てきましたが、生成AIでニュース取得・分析するための大きな課題が「ニュースソースの幅・収集精度・URLなどの信頼性」という点です。
生成AIやニュースAPIの多くは、特定のメディアに偏ったソース取得になりがちです。特に国内の主要メディア(日経新聞、読売新聞など)や専門メディアの網羅性に差があります。
生成AIモデルではDeepSeek以外は、Yahoo!ニュースや主要新聞のソースを適切に取得できないケースが目立ちました。
またGrokやGeminiでは、リンクURLが不正確なケースが多発しました。また多くのAPIでは、まとめサイトやPRTIMESなどのプレスリリースサイトが優先され、一次情報源へのアクセスが困難です。
このような要因から、現時点では生成AIモデル単体でニュース取得を完全に信頼することは難しいと言わざるを得ません。
現時点では生成AIとニュースAPIを組み合わせるアプローチが最も実用的かと思われます。
まとめ・結論
本記事では、2025年の現時点における生成AIを活用したニュース取得・分析の方法について詳細に検証しました。その結果、以下の重要なポイントが明らかになりました。
①生成AIツール単独ではほとんど使えない
生成AIモデル単体でのニュース取得は信頼性に欠ける面があります。特にURLの正確性や日本の主要メディアコンテンツの取得において課題が残ります。
②APIツールとの組み合わせが吉
現時点での最適解は「取得はAPI、分析はAI」という役割分担です。具体的には、Brave SearchのニュースAPIやSerpAPIなどでニュース情報を取得し、その内容をDeepSeekやClaude、ChatGPTなどの生成AIで分析するアプローチが効果的です。
ツール選びの参考
ニュース検索の選択
- 無料で使える「Brave Search」のニュース検索(月2000クエリ)が基本的な用途には十分
- 有料APIの中では、Difyにも組み込まれている「Search API」も月額$40から使用可能
- 「SerpAPI」も月額$75からで安定して主要メディア記事を取得可能
記事の中身取得の手段
- 有料サービス:Firecrawl、jina(共に使えるDify)などが使いやすい
- 無料サービス:crawl4aiも基本機能として十分
- スクレイピング:Beautiful SoupやSeleniumを使った独自実装も検討
ニュース分析のアプローチ
- 長いニュースに対応するにはGemini(1.5proは200万入力token対応)
- o3、Gemini2.5、Claude3.7などのThinkingモデルはニュース分類にも強い
- 有料記事などは別途ログイン処理などが必要
生成AIとニュース分析の統合はまだ発展途上ですが、適切な組み合わせと利用方法を選択することで、すでに業務効率化に大きく貢献できるツールとなっています。
また今後エージェント機能を使ったニュースクローリング手法も更に注目されていくことでしょう。
今後も継続的に各サービスの進化を追跡し、最適な活用方法をチェックしていくことが重要となります。
当社では生成AIを使ったニュースの分析やクリッピング実装などもサポートしていますので、お気軽にご相談くださいませ。