この一方で、ピックアップすると決めたデータ項目は妥協せずにすべてを処理対象にする。「よくサンプリングで10%あればいいと言われるが、ここは徹底的に処理対象にする。末端までデータを使うことでロングテールになり、もの凄くレアなクエリが入ってもサービスが提供できるようになる。これを徹底している企業はあまり聞かない」(小間氏)。
データのフォーマットを全社で統一することにもこだわっている。ヤフーでは、検索やオークションなどすべてのサービスで、ユーザーがアクセスすると同様のフォーマットでログデータが保存されるようになっているという。これらを足し合わせるだけで横断的に分析できるというわけだ。
また顧客との間では単なる受発注という関係ではなく、組織的に協業し、顧客(ビジネス側)とベンダー(システム側)からなるプロジェクトチームを編成するようにしている。それは、社内でも社外でも同様だという。「我々はデータや統計学のことには詳しいけれど、ビジネスのプロではない。一方で、クライアントも恐らくデータのプロではない。そのため、両社の責任者によるプロジェクトを作って、データドリブンなカルチャーを作することを徹底している」(小間氏)。
プロジェクトチームを組むことで、両社からノウハウを出し合うことによる「成果の最大化」や、「コストの削減」が可能になる。さらに、プロジェクトを通してデータサイエンティストの育成にもつながると小間氏は話す。
とはいえ、データを活用しても利益につながる確証はなく、投資に踏み切れない企業も多い。そこでヤフーではデータの実験環境である“遊べる砂場”を自社で用意し、エンジニアや企画担当者に手応えを感じてもらうことで、経営陣の意思決定を後押しする仕組みを設けているという。ただし「資金力がなければなかなか難しい」(小間氏)ことから、すべての企業で実践できないことが現状の課題だとした。
小間氏はビッグデータ活用における次なるキーワードとして「マルチビッグデータ」と「未来予測」を挙げる。
ヤフーではこれまで、さまざまなサービスにデータを活用してきたが、一方で「検索は検索、広告は広告など、シングルソース、シングルユースになっていた」(小間氏)という。今後は、幅広い領域でサービスを提供する同社グループの強みを生かし、それぞれのデータを統合することで「マルチビッグデータを横断活用していきたい」(同)としている。
もう1つキーワードが「未来予測」だ。ヤフーでは、2013年から検索キーワードやTwitterでの言及数などを活用したビッグデータレポートをウェブで公開している。テーマは「東日本大震災」や「景気」などで、参議院選挙の投票前には獲得議席数を予測する試みも行った。同社では、今後もさまざまな形でビッグデータを活用することで、「自社や顧客の課題解決につなげていきたい」(小間氏)としている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力