時系列予測AIによる未来のTwitter投稿件数予測の検証結果
以前の記事で過去のTwitterの投稿件数から、時系列予測AIを利用して未来の投稿件数を予測できるのかという記事を掲載しました。
あれからオリンピックも終了し、実際に予測がどれくらい合っていたのかを実際に検証してみたいと思います。
2021年6月~8月のビール投稿数予測数値
過去10年間のビールとつぶやかれたTwitter投稿件数から、Prophetが算出した2021年6~8月の未来予測が下記となります。
基本は週末に上昇し、季節にある程度相関しているような予測となります。
2021年6月~8月の予測値と実績比較
7月中旬にスパークが見られます。これはなにかと調べてみると、キリンさんの下記キャンペーンがあったことが分かりました。
この投稿による影響を省くと、こんな感じになります。
オリンピックなど予測が難しい要素も含みつつも、結構予測と合っているのではないでしょうか(このキリンさんのキャンペーンの影響か、このタイミングでオーガニック投稿が増えていることも興味深いです)。
気温との関連性はあるか
ビール関連の投稿は、気温が高くなるにつれ増えることが想定されます。そこで試しに東京の体感温度を算出し、投稿件数と比較したのが下記のグラフです。
※体感温度はミスナール式<37 - ( 37 - 気温 ) / ( 0.68 - 0.0014 × 湿度 + 1 / (1.76 + 1.4 × 風速^0.75 ) ) - 0.29 × 気温 × ( 1 - 湿度 / 100 )>で算出しています。
ここで東京の体感温度と投稿数には、0.38という相関係数が出ており、一定の関係があることが分かりました。
特に8月中旬に気温が下がるにつれ、投稿件数が少なくなっている傾向も見て取れます。
誤差関数
続いてこの予測が1日単位でどれくらい当たっているのかを誤差関数で算出します。
MAE(Mean Absolute Error)は2,465となりました。
1日平均2.7万ほどの投稿なので、約1割の誤差というところでしょうか。
これをパーセンテージで表すのが、MAPE(Mean Absolute Percentage Error)です。
こちらは8.48%となりました。
まとめ
ビールのような規則性のある投稿は、人為的な企業キャペーンを除くと1割未満の誤差で予測することができることが分かりました。
特に2020年以降、巣ごもりと飲食店の休業も重なり、ビールの投稿数には大きな影響が出ていることが想定されますが、それでもある程度の予測結果が出せました。
こうした予測データは、SNS広告の予算配分に利用したり、投稿スケジュールに反映したりすると効果的かと思います。
※当社では広報活動のサポートの他、Twitterのデータ取得や分析、各種ダッシュボード作成などもサポートしています。お問い合せフォームよりお気軽にお問い合せください。
▼合わせて読みたい