logo

動画、オークション、コマース-- Yahoo! JAPANを支えるエンジニアたちが語る今と未来 - (page 2)

CNET Japan Ad Special2018年02月07日 12時00分
  • このエントリーをはてなブックマークに追加

「Yahoo!ショッピング」の成長を支えるデータプラットフォーム

 そして、「Yahoo!ショッピングのサービスデータ活用事例」と題したセッションでは、コマースグループ ショッピングカンパニー プロダクション2本部の藤木貴之氏が、Yahoo!ショッピングの成長を支えるデータプラットフォームとその活用事例について紹介した。


ヤフーでYahoo!ショッピングのデータプラットフォーム開発に携わる藤木貴之氏

 サービスの課題を発見し、それを解決することで成長を実現するために、データ分析はPDCAサイクルのあらゆるフェーズで不可欠なものであることは間違いない。では、商品数約2億9000万点を誇るYahoo!ショッピングでは、どのようなデータプラットフォームを構築してデータを活用しているのだろうか。

 藤木氏によると、Yahoo! JAPANではHadoop、TERADATAのデータウェアハウス、そして自社のS3互換ストレージなど、さまざまなプロダクトを導入してデータプラットフォームを構築している。Yahoo!ショッピングではこうしたプラットフォームの中に専用領域を持ってデータを管理。ログなどのデータ処理、システムOLAP、ユーザー解析、オブジェクトの保管などの役割を持たせているのだという。 「これら複数のデータストレージを総合して、私たちではショッピングEDW(エンタープライズ・データ・ウェアハウス)と呼び、ここに必要なデータを必要な形にクレンジングあるいはトランスフォームして一元管理している」(藤木氏)。

Yahoo!ショッピングのデータプラットフォーム
Yahoo!ショッピングのデータプラットフォーム

 では、こうしたデータプラットフォームを用いて、どのようにデータドリブンをしているのだろうか。藤木氏はそのアプローチについて意思決定をデータで行うという方向性とユーザーへのサービス提供をデータで拡充するという方向性を説明した。「前者では、同じ定義で即座に参照できるデータ分析環境の構築が重要になり、後者ではニーズの高いデータを一元管理したり新たに作り出し簡単に引けるデータ利活用の環境を構築することが重要になる」(藤木氏)。

データドリブンのアプローチ
データドリブンのアプローチ

 たとえば、データ分析環境に関しては、同社では現在MicroStrategyやTableauといったBIツールを活用。ショッピングEDWをフルに活用した分析環境を提供しているのだという。藤木氏によると、これまでの作業フローでは分析者は見たいリクエストごとにMart(分析目的に応じて作成されるデータのサマリー)を作成する必要があったが、これでは一つひとつのレポートごとにサマリーデータを作る必要があり、数多くのMartが作成されることでデータ同士に矛盾や相違が生まれてしまうといった課題があったのだという。また、ひとつデータに改修が入った場合には関連するMartもすべて見直す必要があるといった非効率性もあったのだそうだ。

 そこで、現在のデータフローでは、蓄積されているデータを注文データやアクセスログデータを補完する役割の「ファクト」と、データ分析の切り口になるようなデータである「ディメンション」に分類し、それぞれを精緻化していったのだという。「要件ごとにMartを構築するのではなく、ファクトとディメンションに分類されたデータをいつでも参照できるようなデータモデルを構築した。データプラットフォームを中心としたサービス改善のプロセスが構築できている」(藤木氏)。

データを予め分類することでいつでも活用できる環境を実現
データを予め分類することでいつでも活用できる環境を実現

 一方、データ利活用の環境構築においては、ショッピングEDWをYahoo!ショッピングのCRMシステムと連携させることでさまざまなマーケティング施策に応用しているほか、ユーザーの利用履歴などを元にしたプロファイリングも推進し、レコメンドなどに活用しているのだという。加えて、ユーザーのプロファイルや商品カテゴリ毎に予測購買確率を計算しているとのこと。「ショッピングEDWを用いてターゲティングを展開したところ、従来のセグメンテーションと比較してCVRが2倍以上、経由流通が4倍以上に成長した」(藤木氏)。

 藤木氏は、データの利活用を推進する上で重要な点として、「データプラットフォームの整備が非常に重要。データドリブンと聞くとどうしてもデータ分析や利用に眼がいきがちだが、どんなに優秀なアナリストがいたとしても、分析の元になるデータが適切に整備・管理されていなければ、サービスの改善は難しいのではないか」と提言。

 また今後の展開について、藤木氏は「データプラットフォームについてはユーザープロファイルの更なる強化を推進し、またデータの利活用では作成したユーザープロファイルを活用したパーソナライズの強化に取り組んでいきたい。加えて、Yahoo! JAPANを更に便利に使えるサービスにするために、マルチビッグデータの活用にも取り組んでいければ」と語った。

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]