Gaaaon
PR.ready_
Realtime APIでヤフーニュースを取得してみる | AI時代のニュース消費の形を探る
AI/Tech

Realtime APIでヤフーニュースを取得してみる | AI時代のニュース消費の形を探る

OpenAIが公開した新RealtimeAPIを使い、Yahooニュースを実際に探索してみます。

catch-img

Realtime APIでヤフーニュースを取得してみる | AI時代のニュース消費の形を探る

2024-10-18 03:28ブログ

広報 プレスリリース TIPS API メディア分析 AI 機械学習 生成AI / LLM

RealtimeAPIとは

OpenAIから新たにRealtimeAPIが公開されました。最近のOpenAIのデモでも使われたもので、ChatGPTのようなAIとの会話をタイムラグを感じさせることなくリアルタイムですることができます。

Live demo of GPT-4o realtime translation - YouTube

Photo image of OpenAI

OpenAI

1.91M subscribers

Live demo of GPT-4o realtime translation

OpenAI

Search

Watch later

Share

Copy link

Info

Shopping

Tap to unmute

If playback doesn't begin shortly, try restarting your device.

More videos

More videos

You're signed out

Videos you watch may be added to the TV's watch history and influence TV recommendations. To avoid this, cancel and sign in to YouTube on your computer.

CancelConfirm

Share

Include playlist

An error occurred while retrieving sharing information. Please try again later.

Watch on

0:00

0:00 / 1:26

•Live

既にChatGPTのアプリ版には搭載されていますが、今回これがAPIとして公開されました。

Function Callも使用可能

RealtimeAPIは他の生成AIのAPIと同様、外部関数が利用可能なFunction Call機能も搭載されています。

[OpenAI]Function Callingとは?実例で仕組みを解説生成AIの重要機能Function Callingの仕組みの説明、実装方法、ノーコードLLMツールDifyとの関係などを中心に、なるべく分かりやすく解説していきたいと思います。広報・PR支援の株式会社ガーオン

そして早速、ノーコードAIアプリケーション「Dify」のクローリングツールとしても有名なツール「Firecrawl」により、スクレイピング技術と融合させたデモが公開されました。

Twitter Embed

Xでこのポストを表示する

Nicolas Camara\ \

@nickscamara_

·

フォローする

Xで表示

The new Realtime API with web crawling is mind-blowing!

Talk in realtime with any website. Powered by the OpenAI Realtime API and @firecrawl🔥

Check it out: さらに表示

午後4:42 · 2024年10月4日

X広告の情報とプライバシー

1,486 返信

ポストへのリンクをコピー

44件の返信を読む

Using OpenAI's Realtime API and Firecrawl to Talk with Any WebsiteBuild a real-time conversational agent that interacts with any website using OpenAI's Realtime API and Firecrawl.Firecrawl

ブログにもサンプルコードや利用方法などが公開されているため、今回はこちらを日本語で実装してみたいと思います。

実演:RealtimeAPIでYahooニュースを探索してみる

実際の実行状況を以下にアップロードしました。

OpenAIのRealtime APIでYahooニュースを探索する - YouTube

Photo image of PR NAVi | PRナビ

PR NAVi | PRナビ

3 subscribers

OpenAIのRealtime APIでYahooニュースを探索する

PR NAVi | PRナビ

Search

Watch later

Share

Copy link

Info

Shopping

Tap to unmute

If playback doesn't begin shortly, try restarting your device.

More videos

More videos

You're signed out

Videos you watch may be added to the TV's watch history and influence TV recommendations. To avoid this, cancel and sign in to YouTube on your computer.

CancelConfirm

Share

Include playlist

An error occurred while retrieving sharing information. Please try again later.

Watch on

0:00

0:00 / 4:09

•Live

このようにYahooニュースも問題なくスクレイピングできており、ニュースの内容も解説してくれました。

AIとの会話の中で、スクレイピングツール「Firecrawl」をFunction callとして使うことで、ニュースを取得するもので、映像に出てくるニュースの画像は、スクレイピングプロセスの一貫としてキャプチャー(静止画像)を取って表示させたものになります。

機能は現在、指定した単一ページをスクレイピングするscrape_dataと、単一URLからURLを抽出しキーワードで探すmap_websiteの2つが公開されています。

scrape_data

 client.addTool(
  {
    name: 'scrape_data',
    description: 'Goes to or scrapes data from a given URL using Firecrawl.',
    parameters: {
      type: 'object',
      properties: {
        url: {
          type: 'string',
          description: 'URL to scrape data from',
        },
      },
      required: ['url'],
    },
  },
  async ({ url }: { url: string }) => {
    const firecrawl = new FirecrawlApp({
      apiKey: process.env.FIRECRAWL_API_KEY || '',
    });
    const data = await firecrawl.scrapeUrl(url, {
      formats: ['markdown', 'screenshot'],
    });
    if (!data.success) {
      return 'Failed to scrape data from the given URL.';
    }
    setScreenshot(data.screenshot || '');
    return data.markdown;
  }
);

map_website

client.addTool(
  {
    name: 'map_website',
    description: 'Searches a website for pages containing specific keywords using Firecrawl.',
    parameters: {
      type: 'object',
      properties: {
        url: {
          type: 'string',
          description: 'URL of the website to search',
        },
        search: {
          type: 'string',
          description: 'Keywords to search for (2-3 max)',
        },
      },
      required: ['url', 'search'],
    },
  },
  async ({ url, search }: { url: string; search: string }) => {
    const firecrawl = new FirecrawlApp({
      apiKey: process.env.FIRECRAWL_API_KEY || '',
    });
    const mapData = await firecrawl.mapUrl(url, { search });
    if (!mapData.success || !mapData.links?.length) {
      return 'No pages found with the specified keywords.';
    }
    const topLink = mapData.links[0];
    const scrapeData = await firecrawl.scrapeUrl(topLink, {
      formats: ['markdown', 'screenshot'],
    });
    if (!scrapeData.success) {
      return 'Failed to retrieve data from the found page.';
    }
    setScreenshot(scrapeData.screenshot || '');
    return scrapeData.markdown;
  }
);

他のFunction Callと同様、toolに設定するだけ追加実装が可能なため、例えば SEOツールのahrefsをWebサイトを見ながらAIに音声で指示 したり、 音声でXの投稿文を作らせ投稿させる こともできます。

RealtimeAPIは非常に高額

ちなみにこのAPIは音声データを扱うだけあって、他のAPIと比べ非常に割高です。

同じトークン数でもGPT-4o-miniの4倍以上する上に、音声データなのでデータ量そのものがテキストと比べ圧倒的に多いです。

この実験の動画だけでも何回か繰り返していたらあっという間に何十ドルもかかってしまいました。スクレイピングする際は、Firecrawlからの戻りデータ量をある程度制限してLLMに渡したほうが良いでしょう。

コストは時間で解消されると思いますが、早く安くなってほしいものです。

AIが自発的に動くエージェントの時代は、情報消費は人からAIへ

生成AIはFunction Callという外部機能を使うことにより、人間が行う様々な行動の代替が可能となります。

そして生成AIは、それらの行動を自発的に考えて行うことが可能です。

今後はこれまで対人相手に行っていたマーケティングや広報活動も、今後は自発的に行動するAIを対象にする時代が、そう遠くない未来にやってくるかもしれません。

生成AI時代のマーケティング

寝ている間にAIがクローリングして情報収集する時代に

「人間は平等に24時間しか持っていない」と言われた時代は過去の時代になるかもしれません。

映画やドラマ、小説、ニュースなどのコンテンツは、自分のことをよく学習させたAIに”食わせ”さえすれば、面白かったかつまらなかったか、感動するかしないかは判断がつくようになるでしょう。

情報収集は寝ている間にAIが行い、厳選した情報だけを朝に読むということも可能となるでしょう。

そうした時代に入ると、SEOなどが大きな一つの産業となっている中で、「対アルゴリズム」という考えが重要となるかもしれません。

雑誌は紙からAPIへ?

雑誌メディアの衰退が激しいですが、紙媒体が衰退している理由はその流通における産業構造にあり、良いコンテンツが欲しいと思うニーズは今後も減らないでしょう。

2024年4-6月期 雑誌印刷部数を分析する2024年4-6月期の雑誌印刷部数を分析します。広報・PR支援の株式会社ガーオン

良いコンテンツを取材して集め、キュレーションするというメディアの価値そのものは、生成AI後の世界でも依然として強いのではないでしょか。

そうした時代には、情報コンテンツをAPIとして発信することが主流になるかもしれません。APIであればYahooニュースのようにスクレイピングせずに、必要な情報だけを取得することが可能です

生成AI時代の雑誌メディアの方向性

以上、OpenAIが発表した、RealtimeAPIの解説でした。

前の記事 \ prev-article-image\ \ 日経MJに掲載されました 次の記事 \ next-article-image\ \ 2024年7-9月期 雑誌印刷部数を分析する

関連記事

経済YouTube2025年総決算|データが示す"真の王者"と"隠れた実力者

2025-12-27

2025年の経済YouTubeチャンネルを総括します。PIVOT減速、NewsPicks逆転、TBS急成長。そして隠れた王者楽待を深堀り。

調査PRがAI時代に再評価される5つの理由 ~LLM検索で選ばれるための新戦略~

2025-12-20

AI検索(LLM)時代、なぜ「調査PR」が最強の戦略なのか?Ahrefsの最新データとCheckr社の事例をもとに、ChatGPT等で自社が引用されるための5つの理由を解説します。

AI導入、「やる気」だけでは進まない? 米国PR業界719名調査が明かす、本当の課題とは

2025-12-10

PRWeekとボストン大学の共同調査から、広報・PR代理店にAIが浸透しない理由と解決策について解説します。

天才エンジニアが作ったLLM Councilを魔改造してプレスリリース作成ツールを作ってみた

2025-12-04

生成AIを活用したプレスリリース作成専用のツール「Press Council」をご紹介します。

ニュース取得特化ライブラリ newspaper4k は実際に使えるのか検証してみる

2025-11-20

ニュース取得ライブラリ newspaper4k は実際に使えるのか ITメディアの実際の記事で検証して解説します。

2025年7-9月期 雑誌印刷部数を分析する

2025-11-09

2025年7-9月期 雑誌印刷部数を分析します。

広報・PRやプレスリリースまわりでお困りのことはございませんか?

多数の企業サポートを行ってきた当社が解決いたします。

お気軽にお問合せください。

お問合せはこちら

企業情報

gaaaon

© Gaaaon Inc. All Rights Reserved.