Twitterの位置情報を取得し地理別傾向を分析する【ジオタグ分析】
前回は昨年Twitter上で「ビール」と呟かれたデータを使い、未来の投稿数を時系列ライブラリのProfetを使って予測する方法をご紹介しました。
今回は同じデータを使い、どの場所でビールと呟かれたのかを分析してみたいと思います。
Twitterのジオデータとは
Twitterには投稿の際に場所を付与することができ、GPSで取得した市区町村名や建物・店名などを選択式で選ぶことができます。
2020年1月から12月の1年間に「ビール」とつぶやかれた投稿は全708万3,574件(リツイートとメーカー投稿を除外)で、その中でジオデータが含まれている投稿は10万5,731件でした。これは全体の1.5%の割合となります。
ジオタグ分析を解説した代表書籍「Twitterの空間分析」によると、この出現率は2014年の段階で0.4%であったという記載があります。
このことからジオタグ付きツイートの割合は、以前よりも増えていると考えられます。
この地理データはTwitter Search APIなどで取得することができます。
位置情報の区分
位置情報の粒度はtweet_place_typesに入っており、以下の5種類に分かれています。
country |
国 |
[[[122.904034, 24.013343], [122.904034, 45.562897], [153.997697, 45.562897], [153.997697, 24.013343]]] |
admin |
都道府県 |
[[[138.942847, 24.224701], [138.942847, 35.89849], [153.986676, 35.89849], [153.986676, 24.224701]]] |
city |
市区町村 |
[[[139.673228, 35.673404], [139.673228, 35.72991], [139.745133, 35.72991], [139.745133, 35.673404]]] |
neighborhood |
場所(川や浜など) |
[[[173.062638, -41.246544], [173.062638, -41.207572], [173.10031, -41.207572], [173.10031, -41.246544]]] |
poi |
店舗や特定の場所など |
[[[139.880391, 35.632922], [139.880391, 35.632922], [139.880391, 35.632922], [139.880391, 35.632922]]]
※poiの場合だけ4つの座標が全て同じになる
|
例えば作家の藤沢数希さんは2020年に7回ビールとつぶやいており、下記2月1日にはマカオから投稿していることが分かります。
この投稿をSerch APIで取得すると、下記の情報が得られます。
placeという箇所に地理データが記載されています。
このツイートに含まれている位置データは
place_typeが
'place_type': 'poi', 'name': 'Eiffel Tower',
となり、緯度経度が
[[[113.561974, 22.144049],
[113.561974, 22.144049],
[113.561974, 22.144049],
[113.561974, 22.144049]]]
となります。
typeがpoiなので一番粒度の細かいデータであり、全ての緯度経度が同一となっておりことが分かります。
マップでこの場所を見ると
確かにマカオにエッフェル塔がありました。
全10万件超のデータを地図上にプロット
2020年に位置情報が付けられビールと投稿された10万5,731件を地図上にプロットすると下記のようになりました。
place_typeがpoli以外の場合は4つの座標が異なりますが、今回は左上の座標を基準にプロットしており、サイズをFollower/Follow比に設定しています。
こうしてみると意外と海外から投稿されていることなどが分かります。
Twitterの位置情報の解説は下記書籍くらいしか代表的なものがなく、ネットにもあまり活用方法が載っていないため利用するのが難しそうですが、特定のブランドがどの場所で呟かれているのかを調べたり、観光やインバウンドなどの行動データとして分析してみると面白いかもしれません。
以上、Twitterの位置情報を可視化する方法の解説でした。
※当社ではTwitterやInstagramなどのデータ抽出や、データスクレイピングの代行も行っています。ご依頼の際は、お問い合せフォームよりお気軽にお問い合せください。
▼合わせて読みたい