縦横無尽のデータディスカバリツール「Oracle Endeca Information Discovery」

田中猪夫(日本総合研究所 特命研究員)2014年09月16日 12時20分
  • このエントリーをはてなブックマークに追加

 Oracle Endeca Information Discovery(以下、Oracle Endeca)は2011年にOracle社により買収されたデータディスカバリツールだが、その後、日本オラクルでも販売が開始され、世界で600社以上、日本でも数十社の顧客基盤がある。ツールの特徴として非構造化データを対象にできため、Twitterのつぶやきを解析し、自社のソリューションに活用したソフトバンクの事例などが有名だ。

 今回は日本オラクルへの取材を通じ、Oracle Endecaが縦横無尽に横断できるデジタルマーケティング分野での活用のノウハウや、強みをあらゆる角度からディスカバリしてみた。

Oracle Endecaのターゲットユーザー

 「SAP Lumira」と同様に

「Oracleの考えるOracle Endecaのユーザーの位置付け」

を考察してみよう。

  • 「Oracle Advanced Analytics」は、データマイニング/R言語でダイレクト処理や大規模メモリと並列処理による統計解析の高速化を行う「データサイエンティスト」向き製品。
  • 「Oracle Endeca Information Discovery」は、構造化データと非構造化データの紐付を容易に実現し、DBの構造設計が不要、検索中心の操作感で誰でも即座に習熟可能な「ビジネスアナリスト」向けの製品。
  • 「Oracle Business Intelligence」は、固定帳票やダッシュボードによる業務指標の日常的なモニタリングを行うビジネスユーザー&業務ユーザー向け製品。

 Oracle Endecaのターゲットユーザーは「ビジネスユーザー&業務ユーザー」「ビジネスアナリスト」「データサイエンティスト」の3つの中で「ビジネスアナリスト」で、

『「経営担当者」というのはマネージャー(Manager)の訳語である。本書では、この語は事業の諸機能(顧客の創造、マーケティング、革新などを中心とする諸機能)を担当する責任と権限を持つ人々を指しており、その中には、社長から職長に至る広範な層が含まれている。マネージャー(経営担当者)と区別されるのは、「一般労働者」(Ordinary worker)と「専門家職員」(Professional employee)とであり、企業はこの3つの集団から成り立っている。……中略……わが国のいわゆる「部課長」とマネージャーとを実体的に同一視することができるかどうかは一概には言えない。
*「現代の経営」(上、下:P.F.ドラッカー 著 野田一夫 監修 現代経営研究会 訳:1987年4月16日 初版発行)より』

で考察すると、

「ビジネスユーザー&業務ユーザー」→「一般労働者」(Ordinary worker)
「ビジネスアナリスト」→「経営担当者」(Manager)
「データサイエンティスト」→「専門家職員」(Professional employee)

となり、Oracle Endecaはマネジャー(Manager)がターゲットユーザーになる(海外事例では「ビジネスユーザー&業務ユーザー」(Ordinary worker)を含めた数千人規模が利用している例もある)。

3つの製品形態

 Oracleの情報活用ソリューションは「Oracle Advanced Analytics」(類するSAP製品は「SAP InfiniteInsight」)「Oracle Endeca Information Discovery」(類するSAP製品は「SAP Lumira」)「Oracle Business Intelligence」(類するSAP製品は「SAP BusinessObects」)の3つ、「Oracle Endeca Information Discovery」(Oracle Endeca)の製品形態は、

「Oracle Endeca Information Discovery Studio」
「Oracle Endeca Server」
「Oracle Endeca Information Discovery Integrator」

の3つのコンポーネントで構成されている。

 まず、データディスカバリの対象となるデータを構造、非構造と連携・拡充・紐付けするコンポーネントが「Oracle Endeca Information Discovery Integrator」となり、そのデータは「Oracle Endeca Server」に格納され、各ビジネスアナリストはビジュアル分析などを「Oracle Endeca Information Discovery Studio」で行うという製品形態になっている。HTMLで動作し、SAP LumiraTableauのようはデスクトップ版はない。

 一般的に新興データディスカバリベンダーは企業内シェアという観点からすると、利用従業員比率は低い。既存BIベンダーが従来のBIにデータディスカバリ機能を付加した場合、利用従業員比率は高い。ちなみにOracle Endecaの利用ユーザー数は、

某公共機関:ユーザー数 約3000名
某自動車製造業:ユーザー数 1000名以上
某消費財メーカー:ユーザー数 約1000名

と大規模なものも多い。

Oracle Endecaそのものの強み(5 Whys)

 新興データディスカバリベンダー4社(DomoQlikViewSpotfireTableau)と既存BIベンダーのデータディスカバリ対応版(YellowfinSAP Lumira、Oracle Endeca)の7つのツールを取材してきてつくづく実感するのは、ベンダーにより対応が親切な場合とそうでない場合の差が極端なことだ。それはビジネスの積み重ねから来るものなのか、会社の体質なのか、個人の資質からだろうか。

 余談だが、「高飛車というイメージを変える」と日本オラクル幹部(2004年9月17日)から10年後(2014年残暑)の日本オラクルの取材対応は、データディスカバリベンダーの中で最も親切だった。

 さて、Oracle Endecaの機能について言及して行こう。

 事前知識としてQlikView連想技術(Associative Technology)を復習しておく。

  1. 分析軸のどのポイントからでもデータを自由に探索できる
    (ダイナミックかつ双方向なインターフェース)
  2. いかなる疑問にも短時間、リアルタイムで解が得られる
  3. データ同士の関連性もしくは分断を容易に確認できる

 連想技術の3つの特徴を活用することで、「なぜなぜ探索」(5 Whys)が可能になる。5回の「なぜ」を自問自答することによって、ものごとの因果関係とか、その裏にひそむ本当の原因を突きとめることができると、トヨタ生産方式の生みの親である大野耐一さんが、著書「トヨタ生産方式」で主張したことで「5 Whys」と呼ばれ、世界中に浸透した。

 前回の「データディスカバリの主要4ツール比較--デジタルマーケティングに活用」で、QlikViewの特徴を「ひとこと」で表すと、

「なぜなぜ探索(5Whys)のためのデータディスカバリツール」

と表したが、同様にOracle Endecaも構造化&非構造化データの「5 Whys」が可能なデータディスカバリツールだということはあまり知られていない。

Oracle Endecaそのものの強み(非構造データ)

  • 図 Oracle Endeca 5 Whys

 Oracle Endecaは構造化データの「5 Whys」に加えて、非構造化データも同時に同じように取り扱える。例えば、データを「過去」「現在」「未来」と時間軸(第4回:時間軸で学ぶデジタルマーケティング経営)で分けると、

「過去からのデータ(財務管理のデータ)」
「現在からのデータ(POSデータ、日次決算データ)」
「未来からのデータ(iBeaconからのデータ、アクセスログ、MAのデータ、SFA/CRMのデータ、アドテクのデータなど)」

各データソースからのデータは構造化されたものや、

「再加工しないとシステムで識別できない非構造化されたもの」

がある。POSデータとネットでのキャンペーンサイトのウェブアクセスログの相関関係をデータディスカバリしたい場合、2つのデータを比較する必要がある。

「POSがSKU単位で管理=キャンペーンサイトのコンテンツの粒度がSKU単位」

となっていれば、あらゆる角度からデータディスカバリが可能となる。

 しかし、メーカー(ディストリビュータ、リテールが中間に入る)で顧客に商品を提供する場合は、SKU単位で管理されていないPOSからのデータがあった場合も正規化し再加工する必要がある。

  • 図 Oracle Endeca POS

 話を具体化すると、SKU単位で商品がしっかり管理されているコンビニで3種類のRedBullを購入してみたが、レシートに、場所、日付、購入時間、商品名(サイズ付)、売価、数量などの情報がある。33、D、25はサイズでサイズ別にSKU(6本単位SKUとか、在庫保管単位SKUなど)もあるのだろう。

レッドブルエナジー33:\320
レッドブルエナジーD:\205
レッドブルエナジー25:\282

 また、別のスーパーマーケットのレシートを見ると、

1761 サツポロシルクエビス35:\208
1762 アサヒドライBバーライム:\188
1761 キリン イチバン スタウト:\188
1761 サントリー ワゼン:\188

と、商品名に「メーカー名」「商品名」「容器・容量」などが文字列として混在している。

 これをメーカーがPOSデータを集約し、商品別やメーカー別、容器・容量別にビジュアル分析しようとするとデータを再加工(データマネジメント)する必要がある。

 Oracle Endecaは、このような非構造化されたデータそのものを、そのままの形でビジュアル分析が可能で、この機能はPOSだけでなく、

「未来からのデータ(iBeaconからのデータ、アクセスログ、MAのデータ、SFA/CRMのデータ、アドテクのデータなど)」

などでも大活躍でき、さらにグローバルな多言語でも活用可能な強力な機能だ。

Oracle Endecaがオラクル製品だからこその強み(密連携)

 Oracle Endecaの機能以外の強みは、「SAPの強み=SAP Lumiraの強み」であるように「Oracleの強み=Oracle Endecaの強み」となる。専用アプライアンスの「Oracle Exalytics In-Memory Machine」上での動作保証されていることは当然のことだが、Oracle Endecaは、

「Oracle Business IntelligenceやOracle EBSと密連携」

しており、Oracle Endecaのデータソースとして「Oracle Business Intelligence」のリポジトリを参照することが可能で、「Oracle Business Intelligence」で開発したアセットをOracle Endecaで再利用することができる(この機能は地味だが重要なポイントで、SAPもこの点を力説している)。

 また、統計解析は「Oracle Advanced Analytics(R言語を含む)と密連携」、SAS、SPSSなどの連携実績も多数あるようだ。

Oracle Endecaを「モノの軸」で考えたときの強み(疎連携)

 データディスカバリツールはデジタルマーケティングを縦横無尽に横断できることについて言及したい。これは意外とデジタルマーケティングに関る方々もご存知ないことが多く、単純に「BI=データディスカバリ」と勘違いしている人もいる。

 ここでは話を整理するため、デジタルマーケティングを「モノの軸」、つまり商品コンテンツの軸と、「人の軸」(クッキーから個人情報まで)の2つの軸(縦横)で考察する。

 まずは、「モノの軸」とOracle Endecaを考察してみよう。

「商品コンテンツの粒度をSKU単位」

にすることは、O2O、オム二チャネル、データディスカバリにおけるデータ分析においての原則であることは「第7回:地球儀から学ぶデジタルマーケティング経営」にもまとめた。

『オムニチャネル、O2Oなどが話題になるが、POSなどで管理されている商品はSKU(Stock Keeping Unit)単位、デジタルマーケティングのウェブ、タブレット、スマホサイトはPage単位でデザインされているこが多い。Online側がPageで管理され、Offline側がSKU単位で管理されていては「O≠O」となり、Online側とOffline側の整合性が取りにくく、グローバルな拡張性もない。オムニチャネルをドメステックで実現する際もROI(Return On Investment)計測などが行いにくい。』

 オム二チャネル、O2O、グローバルWebに必ず必要になるのは、従来のWebコンテンツ管理の機能だけでなく、

「グローバル商品情報管理の基盤(グローバルPIM)」

で、グローバルPIMに格納されたコンテンツがデザインテンプレート(オンライン、オフライン)を経て、PC、印刷(オフライン)、タブレット、スマホなどの各チャネルに配信される必要がある。そして、「人の軸」でセグメンテーションされたフィルターを通し、

「個人にターゲッティングされたコンテンツが提供される」

 こういった機能を提供するグローバルPIMは顧客のデジタルエクスペリエンスを高めるもので、SAP HybrisがAdobe Analyticsと連携したり、Oracle WebCenter SiteがGoogle AnalyticsやRTmetricsと連携し、データディスカバリツールと疎連携することで、

『「モノの軸」としてSKU毎のデータを「過去」「現在」「未来」と時間軸で分け合理的な判断につなげることができる』(第4回:時間軸で学ぶデジタルマーケティング経営

「モノの軸」からの合理的な経営判断基盤の2つのformula

 グローバルPIMはSKU単位に商品コンテンツが格納できるもの、ウェブなどのアクセスログ分析ツールは日本ではAdobe Analytics、Google Analytics、RTmetricsの3種程度だが、データディスカバリツールはOracle Endeca、SAP LumiraYellowfinDomoQlikViewSpotfireTableauの7つのどれかを疎連携できるだろう。

  • このエントリーをはてなブックマークに追加