logo

“感情分析”から広がる「ヤフー リアルタイム検索」の可能性--開発チームに聞く

井指啓吾 (編集部)2014年12月09日 08時30分
  • このエントリーをはてなブックマークに追加

 ヤフーは11月、SNS上の投稿を検索できるサービス「リアルタイム検索」に、Twitterの投稿を分析し、検索したキーワードに対してどのような感情を持っているかをポジティブ/ネガティブ(ポジネガ)で判定する機能「つぶやき感情分析」の“正式版”を実装した。

 従来との主な変更点は、分析できる言葉が大幅に拡張されたこと。これまでは頻繁に検索される1万1000語とその時に話題になっているキーワードのみが対象だったが、あらゆる言葉で感情を分析できるようになった。また、分析システムが辞書方式から機械学習方式に変更されたことで、学習を重ねることで分析精度を高められるようにもなった。

 この感情分析機能は、ヤフーとYahoo!(米ヤフー)の共同開発によるものという。もともと検索分野を中心に協力していたが、今回は自然言語処理や機械学習をあわせた要素技術が必要となったことから、同分野に長けた米ヤフーが開発に加わったそうだ。

 同機能の狙いやリアルタイム検索の今後の展望について、ヤフー 検索企画本部 リアルタイム検索・メディアサイエンスリーダーの清水徹氏、サービス本部リアルタイム検索担当の一戸美穂氏、同 萩原暁子氏と、米ヤフー リサーチサイエンティストの野畑周氏に聞いた。


左から、清水徹氏、萩原暁子氏、野畑周氏(モニター上)、一戸美穂氏。野畑氏にはテレビ会議システムを使い、米国から取材に応えてもらった

 リアルタイム検索の開発コンセプトは「ココロが動く検索」。通常のウェブ検索時の“なにかを知りたい”とは異なる欲求に応えることを目的としており、具体的には「見ること自体がエンターテインメント」なサービスを目指しているという。

 感情分析はそれを実現する一機能として実装したものだ。ヤフーでは開発当初から感情を判定できるトピックの幅広さと判定精度を課題だと認識していたため、これまでベータ版という“限定付き”の状態で提供していた。一戸氏は「これまでは対象がとても限定的だったため『使いたい時に使えない機能』だった。ニーズがあるのを取りこぼしていたので、私たちとしても歯がゆかった」と振り返る。

 開発時には、ポジネガの2種類の感情を判定するモデルを機械学習で作った。使用したデータは、人間のエディターが投稿の感情を判定した「正解データ」と、基本となる単語や顔文字などからポジネガを推定し、学習として使えるよう形にしたデータの2種類。野畑氏によれば、一般的に正解データが多ければ多いほど、システムとして学習した際の精度が上がるという。

 この感情分析機能は、実はリアルタイム分析への実装に先んじて「ヤフー トレンドコースター」に搭載していた。トレンドコースターの上下の動きは時間当たりのツイート数の変化で決まり、左右の動きは感情分析の結果で決まるが、その時間当たりのポジネガを明確に出すことは、今回のカバー範囲の非常に広い感情分析機を作って初めて可能になったという。

  • ヤフー トレンドコースター

 今後は判定機の精度の向上を図り、見せ方を改善していく予定。「データをより増やして精度を高めたい。そこから先は実際の用途によるが、感情の種類を増やすことも一つの方向性として考えられる」(野畑氏)。「分析精度が高まるのにあわせ、どういう見せ方であればより使いやすいのかを常に検討していきたい」(萩原氏)。

 また、ポジネガを判別した理由を掲示する機能も視野に入れる。「技術的には非常にチャレンジング。まだ夢の段階かも知れないが、ある話題がポジネガだったとして、どうしてそれがポジネガだったのかの説明ができるようにしたい」(清水氏)。

 さらに清水氏が「もともと考えている」と語るのは、Twitterから検出できるさまざまな情報から、世の中で起こっていることを検出すること。具体的には、高速道路での渋滞や火事、事件、ウェブサービスの障害などを、あるワードや地名が盛り上がっていることから分析して検出する。

 「たとえば、主要なウェブサービス名で検索し、一時期に(グラフ上に)ネガティブの山ができていた場合、それがアクセス障害が起きていた時期に対応する。感情分析はそういった出来事を観測する際に、サービスにまつわる一般的な話題での盛り上がりと、なにかよからぬことによる盛り上がりを切り分けるときの手がかりになる」(清水氏)。

 なお感情分析の開発時にはヤフーと米ヤフーの2社間で、日本時間の朝方(米国は夕方)に2週間に1回ほどビデオ会議を開き、進捗を確認したり、解決すべき問題を共有したりしていたそうだ。

  • 画面右側中断に感情分析の結果が表示される

 感情分析はビジネスシーンでの利用も想定している。たとえば、新商品や新サービスの発表時。「Twitterの投稿に消費者の率直な声が反映されていると思う。新商品への消費者の反応を簡易的に調べたいときや、忌憚のない意見を聞きたいときに使ってほしい」(萩原氏)。

 ビジネスユーザー向けに有料サービスを提供する計画はないが「可能性がないわけではない」(一戸氏)。今後、それも含めてリアルタイム検索自体のビジネス化を考えていきたいとし、感情分析で得られたデータの活用については「いずれ考えていきたいとは思うが、現状すぐに(なにかに活用する)というのはない」と説明した。

 「リアルタイム検索の役目は、Yahoo!検索を盛り立てていくこと。リアルタイム検索でYahoo!検索をより身近に感じてもらい、Yahoo!検索を面白いと思ってもらえるきっかけを作りたい。今のウェブ検索では探せないような新しい情報やコアな情報を見つけやすくしていって、Yahoo!検索に人を呼べるようなサービスになれば嬉しい」(一戸氏)。

-PR-企画特集