CNET Japan Live 2017

データサイエンティストが語る「機械学習の理想と現実」--得意・不得意とは

  • このエントリーをはてなブックマークに追加

 2月21日と22日の2日間に渡り、本誌主催のイベント「CNET Japan Live 2017 ビジネスに必須となるA.Iの可能性」を開催した。人工知能、機械学習、ディープラーニングといった言葉を耳にしない日はないほど、AIにまつわるキーワードがあふれている昨今、それらがビジネスにどのような影響を与え、あるいはビジネスでどう役立つのか。実際にAIを活用している各社の見解や取り組みを知ることで、AIの将来性や自社事業への導入可能性を探った。

 講演「あなたの会社でAI/機械学習によるデータ活用が進まない理由」では、DataRobotのデータサイエンティストであるシバタアキラ氏が登壇し、同社の機械学習プラットフォームのデモを行うとともに、ビジネスの現場でどうAIと向き合うべきかを解説した。

DataRobotのシバタアキラ氏(データサイエンティスト)
DataRobotのシバタアキラ氏(データサイエンティスト)

機械学習の真髄は「すでにあるデータ」を分析し、将来を予測すること

 シバタ氏が今回の講演で主題にとりあげたのが、AIの中でも特に「機械学習」と呼ばれる分野だ。データの中に潜むパターン性を、コンピュータの膨大な計算力を活かして発見するための手法であり、ビジネスの現場においては売上予測などに用いられる。

 その応用例として、シバタ氏は壇上で「携帯電話契約者が今後3カ月で解約するかどうかを機械学習で予測する」というデモを行った。手元には約3000人分の顧客情報(デモ用)を用意し、そこには電話番号、居住州、契約期間、国内通話時間、国際通話時間、着信回数、コールセンターに電話をかけた回数などが含まれている。

 そして「このデータの利用者が実際に3カ月で解約したかどうか」の結果も記載されており、これが機械学習における「教師」データにあたる。これらを総合し、解約に繋がる要因をAIで分析した。

 実際の操作は、Excelにまとめられた顧客情報をDataRobotのプラットフォームにドラッグ&ドロップし、最小限の設定を行う程度。分析にかかる時間は元のデータ量にも依存するが、今回のデモでは、コールセンターに電話をかけてきた回数が解約要因として比重が高いとの分析がなされた。シバタ氏は「これまでデータサイエンティストでしかできなかった高度な予測モデルを、簡単な手順で作成ができる」と、機械学習プラットフォームとしてのDataRobotの魅力をアピールした。

機械学習のデモ画面
機械学習のデモ画面

機械学習の得意・不得意

 機械学習はさまざまな企業への導入が期待される。一方、報道などの影響で過度な期待感がもたれているともシバタ氏は指摘する。例えば「会社の社長を誰にするか」「今後どのような企業を買収すべきか」といった事象の判断は、そもそも発生回数が少なく、現状では機械学習に不向きという。

機械学習の得意領域を示したチャート。4つに大別した中でも「専門業務」における有効度が高いという
機械学習の得意領域を示したチャート。4つに大別した中でも「専門業務」における有効度が高いという

 また、機械学習にはその素地となるデータが必ず必要になる。このため、新規ビジネスを立ち上げるにあたって、その需要予測などを行うにしても、データがなければ予測のしようがない。

 また、シバタ氏が企業から相談を受ける中で「データはもう一杯持っている(から何かに使えないか)」と切り出されることも多いという。しかし、そうはいっても「集めやすいから集めたデータ」では意味がない。何らかの経営課題があって、それを解消するためにどんなデータが必要かを見極めた上でなければ、予測モデルの作成に必要な真のデータにはなりえない。

 現状で最も効果を発揮するとみられるのは「専門スタッフにしかできない」「頻度が高い」業務の予測モデル。シバタ氏は一例として、銀行における与信判断などを挙げた。

データサイエンティストでなくとも予測モデルを作成できる時代に

 機械学習を全社的に活用していくにあたっては、当然ながらまず専門部署などが先行して検証を行っていくことになる。しかし、その専門性の高さゆえに外部から奇異にみられ、経営層や現場レベルから理解が得られない、あるいは反発を受けることすらある。

 シバタ氏は「外からブラックボックスのように見られることを、いかに“グレーボックス”にできるかが重要」と言及。機械学習でなぜそういった分析結果が出たのかを分かりやすく説明することが重要であり、DataRobotでもそのための各種機能を用意している。

 一般に、ビッグデータを解析する「データサイエンティスト」は高度な職能を必要とし、絶対的に人手不足とされる。しかしシバタ氏は、DataRobotのようなサービスの登場によって、プログラミングや数学の知識がなくても、高度な分析が行えるようになりつつあると説明。「寿司屋の腕は包丁さばきだけでは決まらない。(自分で漁はしなくても)築地のどの店にいけば良い海老を仕入れられるか、そういった知識を持っていることも条件の1つ」と補足し、本来の業務・業界への深い理解こそが、機械学習の活用にあたって重要だと強調した。

ツールの普及により、予測モデル生成はどんどん身近になっていくと考えられる
ツールの普及により、予測モデル生成はどんどん身近になっていくと考えられる
  • このエントリーをはてなブックマークに追加