
Realtime APIでヤフーニュースを取得してみる | AI時代のニュース消費の形を探る
2024-10-18 03:28ブログ
広報 プレスリリース TIPS API メディア分析 AI 機械学習 生成AI / LLM
RealtimeAPIとは
OpenAIから新たにRealtimeAPIが公開されました。最近のOpenAIのデモでも使われたもので、ChatGPTのようなAIとの会話をタイムラグを感じさせることなくリアルタイムですることができます。
Live demo of GPT-4o realtime translation - YouTube
OpenAI
1.91M subscribers
Live demo of GPT-4o realtime translation
OpenAI
Search
Watch later
Share
Copy link
Info
Shopping
Tap to unmute
If playback doesn't begin shortly, try restarting your device.
More videos
More videos
You're signed out
Videos you watch may be added to the TV's watch history and influence TV recommendations. To avoid this, cancel and sign in to YouTube on your computer.
CancelConfirm
Share
Include playlist
An error occurred while retrieving sharing information. Please try again later.
0:00
0:00 / 1:26
•Live
•
既にChatGPTのアプリ版には搭載されていますが、今回これがAPIとして公開されました。
Function Callも使用可能
RealtimeAPIは他の生成AIのAPIと同様、外部関数が利用可能なFunction Call機能も搭載されています。
そして早速、ノーコードAIアプリケーション「Dify」のクローリングツールとしても有名なツール「Firecrawl」により、スクレイピング技術と融合させたデモが公開されました。
Twitter Embed
·
The new Realtime API with web crawling is mind-blowing!
Talk in realtime with any website. Powered by the OpenAI Realtime API and @firecrawl
Check it out: さらに表示
ポストへのリンクをコピー
ブログにもサンプルコードや利用方法などが公開されているため、今回はこちらを日本語で実装してみたいと思います。
実演:RealtimeAPIでYahooニュースを探索してみる
実際の実行状況を以下にアップロードしました。
OpenAIのRealtime APIでYahooニュースを探索する - YouTube
PR NAVi | PRナビ
3 subscribers
OpenAIのRealtime APIでYahooニュースを探索する
PR NAVi | PRナビ
Search
Watch later
Share
Copy link
Info
Shopping
Tap to unmute
If playback doesn't begin shortly, try restarting your device.
More videos
More videos
You're signed out
Videos you watch may be added to the TV's watch history and influence TV recommendations. To avoid this, cancel and sign in to YouTube on your computer.
CancelConfirm
Share
Include playlist
An error occurred while retrieving sharing information. Please try again later.
0:00
0:00 / 4:09
•Live
•
このようにYahooニュースも問題なくスクレイピングできており、ニュースの内容も解説してくれました。
AIとの会話の中で、スクレイピングツール「Firecrawl」をFunction callとして使うことで、ニュースを取得するもので、映像に出てくるニュースの画像は、スクレイピングプロセスの一貫としてキャプチャー(静止画像)を取って表示させたものになります。
機能は現在、指定した単一ページをスクレイピングするscrape_dataと、単一URLからURLを抽出しキーワードで探すmap_websiteの2つが公開されています。
scrape_data
client.addTool(
{
name: 'scrape_data',
description: 'Goes to or scrapes data from a given URL using Firecrawl.',
parameters: {
type: 'object',
properties: {
url: {
type: 'string',
description: 'URL to scrape data from',
},
},
required: ['url'],
},
},
async ({ url }: { url: string }) => {
const firecrawl = new FirecrawlApp({
apiKey: process.env.FIRECRAWL_API_KEY || '',
});
const data = await firecrawl.scrapeUrl(url, {
formats: ['markdown', 'screenshot'],
});
if (!data.success) {
return 'Failed to scrape data from the given URL.';
}
setScreenshot(data.screenshot || '');
return data.markdown;
}
);
map_website
client.addTool(
{
name: 'map_website',
description: 'Searches a website for pages containing specific keywords using Firecrawl.',
parameters: {
type: 'object',
properties: {
url: {
type: 'string',
description: 'URL of the website to search',
},
search: {
type: 'string',
description: 'Keywords to search for (2-3 max)',
},
},
required: ['url', 'search'],
},
},
async ({ url, search }: { url: string; search: string }) => {
const firecrawl = new FirecrawlApp({
apiKey: process.env.FIRECRAWL_API_KEY || '',
});
const mapData = await firecrawl.mapUrl(url, { search });
if (!mapData.success || !mapData.links?.length) {
return 'No pages found with the specified keywords.';
}
const topLink = mapData.links[0];
const scrapeData = await firecrawl.scrapeUrl(topLink, {
formats: ['markdown', 'screenshot'],
});
if (!scrapeData.success) {
return 'Failed to retrieve data from the found page.';
}
setScreenshot(scrapeData.screenshot || '');
return scrapeData.markdown;
}
);
他のFunction Callと同様、toolに設定するだけ追加実装が可能なため、例えば SEOツールのahrefsをWebサイトを見ながらAIに音声で指示 したり、 音声でXの投稿文を作らせ投稿させる こともできます。
RealtimeAPIは非常に高額
ちなみにこのAPIは音声データを扱うだけあって、他のAPIと比べ非常に割高です。

同じトークン数でもGPT-4o-miniの4倍以上する上に、音声データなのでデータ量そのものがテキストと比べ圧倒的に多いです。
この実験の動画だけでも何回か繰り返していたらあっという間に何十ドルもかかってしまいました。スクレイピングする際は、Firecrawlからの戻りデータ量をある程度制限してLLMに渡したほうが良いでしょう。
コストは時間で解消されると思いますが、早く安くなってほしいものです。
AIが自発的に動くエージェントの時代は、情報消費は人からAIへ
生成AIはFunction Callという外部機能を使うことにより、人間が行う様々な行動の代替が可能となります。
そして生成AIは、それらの行動を自発的に考えて行うことが可能です。
今後はこれまで対人相手に行っていたマーケティングや広報活動も、今後は自発的に行動するAIを対象にする時代が、そう遠くない未来にやってくるかもしれません。

寝ている間にAIがクローリングして情報収集する時代に

「人間は平等に24時間しか持っていない」と言われた時代は過去の時代になるかもしれません。
映画やドラマ、小説、ニュースなどのコンテンツは、自分のことをよく学習させたAIに”食わせ”さえすれば、面白かったかつまらなかったか、感動するかしないかは判断がつくようになるでしょう。
情報収集は寝ている間にAIが行い、厳選した情報だけを朝に読むということも可能となるでしょう。
そうした時代に入ると、SEOなどが大きな一つの産業となっている中で、「対アルゴリズム」という考えが重要となるかもしれません。
雑誌は紙からAPIへ?
雑誌メディアの衰退が激しいですが、紙媒体が衰退している理由はその流通における産業構造にあり、良いコンテンツが欲しいと思うニーズは今後も減らないでしょう。
2024年4-6月期 雑誌印刷部数を分析する2024年4-6月期の雑誌印刷部数を分析します。広報・PR支援の株式会社ガーオン
良いコンテンツを取材して集め、キュレーションするというメディアの価値そのものは、生成AI後の世界でも依然として強いのではないでしょか。
そうした時代には、情報コンテンツをAPIとして発信することが主流になるかもしれません。APIであればYahooニュースのようにスクレイピングせずに、必要な情報だけを取得することが可能です

以上、OpenAIが発表した、RealtimeAPIの解説でした。
前の記事 \
\
\
日経MJに掲載されました 次の記事 \
\
\
2024年7-9月期 雑誌印刷部数を分析する
関連記事
経済YouTube2025年総決算|データが示す"真の王者"と"隠れた実力者
2025-12-27
2025年の経済YouTubeチャンネルを総括します。PIVOT減速、NewsPicks逆転、TBS急成長。そして隠れた王者楽待を深堀り。
調査PRがAI時代に再評価される5つの理由 ~LLM検索で選ばれるための新戦略~
2025-12-20
AI検索(LLM)時代、なぜ「調査PR」が最強の戦略なのか?Ahrefsの最新データとCheckr社の事例をもとに、ChatGPT等で自社が引用されるための5つの理由を解説します。
AI導入、「やる気」だけでは進まない? 米国PR業界719名調査が明かす、本当の課題とは
2025-12-10
PRWeekとボストン大学の共同調査から、広報・PR代理店にAIが浸透しない理由と解決策について解説します。
天才エンジニアが作ったLLM Councilを魔改造してプレスリリース作成ツールを作ってみた
2025-12-04
生成AIを活用したプレスリリース作成専用のツール「Press Council」をご紹介します。
ニュース取得特化ライブラリ newspaper4k は実際に使えるのか検証してみる
2025-11-20
ニュース取得ライブラリ newspaper4k は実際に使えるのか ITメディアの実際の記事で検証して解説します。
2025年7-9月期 雑誌印刷部数を分析する
2025-11-09
2025年7-9月期 雑誌印刷部数を分析します。
広報・PRやプレスリリースまわりでお困りのことはございませんか?
多数の企業サポートを行ってきた当社が解決いたします。
お気軽にお問合せください。
企業情報
© Gaaaon Inc. All Rights Reserved.












