TikTokのデータを非公式APIで取得する方法
目次[非表示]
これまでTwitter APIやInstagram APIを紹介してきましたが、今回はTikTokのデータをAPIで取得する方法をご紹介したいと思います。
購買に大きな影響を与えるTikTok
TikTokはリコメンドアルゴリズムが非常に優れており、Twitterよりも拡散性が高いと言われています。
またInstagramと同様、消費にも直接的な影響を与えるケースが多い、TikTok経由でのバカ売れなどが話題となっています。
非公式TikTok APIでデータを抽出する
さて肝心のTikTokのデータ取得方法ですが、残念ながら公式APIは広告などの一部に限られ、データ取得のためのAPIは正式公開されていない模様です。
こうした状況ですが、Python上でTikTokをスクレイピングしてデータを取得してくれる非公式APIが作成・公開されているようなので、今回はこちらをご紹介させていただきます。
このTikTok APIは日本語での解説も非常に少なく、色々と躓くポイントが多いかと思われます。
下記You Tubeに製作者?の解説動画がありましたが、この動画通りVS CODEを使って動かすのが良さそうです(Google Colabではエラーで動きませんでした)。
非公式TikTok APIの仕組み
このAPIはTwitterの公式APIなどとは異なり、「PlayWright」というスクレイピングライブラリを使って、本家サイト?からデータを取得してくるという仕組みのようです。
get_trendingで人気投稿を落としてみる
今回はいくつか機能がある中で、人気投稿を取得できる「get_trending」というものを使ってみたいと思います。
これはいいね数や再生数の多いトレンド投稿を落としてくるものだと思われますが、どういうロジックで落としてくるのかは今回よく分かりませんでした(分かり次第追記いたします)。
※追記:不安定のようで取得できたりできなかったりするようです
試しにいいね数と再生数、ユーザー名を取得した場合下記のようになります。
落とせるデータは結構多い
落としてこれるデータに関しては、動画に紐づくものとユーザーに紐づくものが取れるようです。
{'diggCount': 4000000, 'shareCount': 48100, 'commentCount': 36500, 'playCount': 33200000},
{'followingCount': 102, 'followerCount': 26500000, 'heartCount': 697400000, 'videoCount': 892, 'diggCount': 6945, 'heart': 697400000},
またregionの設定をしないと日本意外の投稿も多く集まってしまうため、このあたりの設定もいずれ深堀りできればと思います。
最後にせっかくなので取得したデータはデータポータルに落として、一覧で見られるようにしてみたいと思います。下記リンクよりご確認いただけます。
https://datastudio.google.com/s/qaAsTW9e-vY
以上、TikTokの非公式APIのご紹介でした。
▼合わせて読みたい