Yahoo! JAPANはビッグデータで経済指標の夢を見た

田中好伸 (編集部)2013年04月17日 18時48分
  • このエントリーをはてなブックマークに追加

 自民党が政権に復帰し、安倍首相となってから“アベノミクス”が始まり、国内で景気に対する期待感が高まってきた。日本銀行の“異次元緩和”が始まり、日経平均株価は高騰し、日本の景気も長いトンネルを抜けていよいよ…。

 日本の経済が良くなっているのか悪くなっているのか、これからどんな方向に向かっているのか――。そうした経済の状況を理解するために使えるのが、3カ月ごとに発表される日銀短観や国内総生産(GDP)、景気動向指数などの経済指標だ。

 これらの経済指標は統計によるものであり、的確に状況を示すが、問題がある。リアルタイムではないことだ。この問題を解決しようとヤフーが挑戦した。Yahoo! JAPANが抱えるデータ、いわゆるビッグデータを活用して“景気のなう”を明らかにすることを試みた。

景気動向と連動する検索キーワード

 Yahoo! JAPANのデータと景気の関連性を導き出すためには。景気を客観的に判断するためのベースとなる指標が必要になる。そこで同社は、内閣府が毎月発表する「景気動向指数(CI)」から「景気動向一致指数」を基準に検証した。

 景気動向一致指数とYahoo! JAPANのデータを比較して関係性のあるデータを抽出、そこから「Yahoo! JAPAN景気指数」を導き出そうとした。では、Yahoo! JAPANのデータの中でどんなデータが適しているのか? 前提となるのは、データ量が極力大きく、長期間存在し、人々の行動や心理、世相と風潮が反映されやすい…。そこで「Yahoo!検索」のキーワードで検証してみた。

 必要になるのが、検索キーワードの中から景気動向一致指数の推移と相関関係がありそうなものを見つけ出すことだ。そこでヤフーは、2012年の検索キーワード約75億種類の中から分析で必要となる、毎日一定以上検索された約60万のキーワードを抽出して検証対象にした。そのキーワード群すべてで2009年12月~2013年2月の月間の検索数の推移と景気動向一致指数の推移の相関を調べた。

 このグラフを見ると1.0もしくは-1.0に近付けば近付くほど、その検索キーワードの月間検索数の動きと景気動向一致指数の動きとの相関性が高いと判断できる。多くの検索キーワードは相関が低かったが、ごく一部で高い相関を持つキーワードの存在が確認できたという。

 特に相関が高い0.8以上もしくは-0.8以下を基準に抽出すると、約60万のキーワードの内の3000分の1が該当した。そのキーワードの中から推移傾向が非常に似ているキーワードを足し上げる処理も行った。

Yahoo! JAPAN景気指数を導き出す検索語を厳選
※クリックすると拡大画像が見られます

 景気動向一致指数と相関の高いキーワードをもとに、景気の予測のキモとなる「Yahoo! JAPAN景気スコア」を算出する。算出方法は以下の通りだ。

厳選した検索語を相関計数値で重みづけをして統合
※クリックすると拡大画像が見られます

 この方法で求められたのがYahoo! JAPAN景気スコアになる。このスコアと景気動向一致指数を用いて回帰式から傾きと切片を特定する。これをもとにYahoo! JAPAN景気指数を求めた。


※クリックすると拡大画像が見られます
  • このエントリーをはてなブックマークに追加