グーグル、インテル、MSが注目するベイズ理論

今日のコンピュータ界を動かす18世紀の確率論

 今日のコンピュータ界をリードする権威ある数学者の1人であるThomas Bayes(トーマス・ベイズ)は、他の数学者と一線を画する。ベイズは神の存在を方程式で説明できると主張した人物だ。そんな彼の最も重要な論文を出版したのはベイズ本人ではなく他人であり、また、彼は241年前に亡くなっている。

 ところが、なんとこの18世紀の聖職者が提唱した確率理論が、アプリケーション開発の数学的基礎の主要な部分を占めるようになっているのだ。

 上記数式はベイズの定理を示したものである。難解な記号の羅列に見えるかもしれないが、大雑把に言うと何かが起こる可能性はその事柄の過去の発生頻度を使ってほぼ推測ができるということだ。研究者はこの考え方を遺伝子研究から電子メールの選別にまで応用しようとしている。

 ベイズ定理の数学的な詳細説明はミネソタ大学のウェブサイトに掲載されている。また、Gametheory.netのベイズ法則アプレットには、「ある病気の検査で陽性となった場合、どの程度心配するべきなのか」というような質問への答えが掲載されている。

 サーチエンジン超大手のGoogleと情報検索ツールを販売するAutonomyの両社もベイズの原理を採用し、百発百中ではないにしろ高い確率で適当なデータを探し当てる検索サービスを提供している。様々な分野の研究者も、特定の症状と病気の関連付けや個人用ロボットの創造、過去のデータや経験に基づく指示に沿って行動し「考える」ことができる人工知能デバイスの開発などにベイズモデルを使っている。

 また、Microsoftも積極的にベイズモデルを支持している。同社は確率論(または確率論的原則)に基づく考えを同社のNotification Platformに採用している。このテクノロジーは将来的に同社のソフトウェアに組み込まれる予定で、それによりコンピュータや携帯電話がメッセージや会議予定に自動フィルタをかけたり、コンピュータなどの持ち主が他人と連絡を取りあうための最善策を考えたりすることができるようになる。

 うまくいけばこのテクノロジーは、人間の日課となっている行動を判断し、常に変化する状況下で人間の生活を管理する電子執事のようなものを生み出すだろう。

 Microsoftの研究機関であるMicrosoft Researchのシニアリサーチャー、Eric Horvitzは「コンピュータ化や帯域幅の方向性を見極める時にベイズ理論研究を使う」と語る。「不確実な状況においては全てを知ることは不可能だ。そんな時、確率論は全ての知能の基礎にあると個人的には考えている」

 今年の終わり頃には、Intelがベイズ型アプリケーション開発用のツールキットを発表する予定である。患者が発作に襲われる兆候があることをカメラで認識し、医師に警告するシステムの実験も既に行われている。これらのシステム開発については同社のDeveloper Forumでも議論された。

 今日でこそ支持されているベイズ理論だが、いつも広く受け入れられてきたわけではない。ほんの10年前には、ベイズ理論の研究者も研究の外郭部分について語っていただけだった。しかしその後、数学的モデルの進歩やコンピュータの高速化、そして各種実験で有効な結果が得られたことなどが後押しとなり、ベイズ学派が新たな信頼を得るようになったのだ。

 Intelマイクロプロセッサ研究所のアプリケーションソフトウェアテクノロジー管理部マネージャーであるOmid Moghadamも次のように言っている。「具体的に応用できるレベルでないうちに大きく取り上げられすぎたのも問題のひとつだった。本当の実用化が進んだのは最近10年間の話だ」と。

ベイズ理論とは何か

 ベイズ理論は、おおまかに言うと「未来を推測するには過去を振り返らなければならない」と要約することができる。つまり、ベイズは未来の出来事の確率はその事象の過去の発生頻度を求めることで計算できると説いたのだ。例えば、宙に投げられたコインが表向きに着地する確率が0.5であることは実験データから分かるといった具合だ。

 スタンフォード大学のRon Howard教授は、「ベイズ曰く、全ての事柄は必然的に不確実で、その確率の分布は様々である」と述べている。

 例えば、コインの代わりにプラスチックの押しピンを投げて、針が上向きの状態で落ちる確率や、ピンが横向きに落ちた場合に針がどちら向きになるかを調べたいとする。結果に影響を与えると思われるのは、押しピンの形状、製造工程でのばらつき、重量分布などの要素だけでなく、ピンの着地パターンの種類の多さだ。

 ベイズ理論の魅力はその誤解を招きかねないほどの単純さにある。ベイズ理論では、完全に現実の世界から集められたデータに基づいて推測を行い、データの数が多ければ多いほどより確実な推測を引き出せる。また、ベイズモデルは自己修正型モデルであり、データの変化に応じて結果が変わる。このこともベイズ理論の強みだ。

 確率論に関する考え方の変化がコンピュータと人間の関係も変えている。Googleのセキュリティ品質部門ディレクターであるPeter Norvigによると、「コンピュータは最終的なデバイスではなく補助的なものであるというのが最近の考え方だ。人間は模範解答ではなく何らかのガイダンスを求めるようになった」とのことだ。

 このような変化はまた、サーチ機能にも大きな効用をもたらしている。数年前に一般的に使われていたブール型と呼ばれるサーチエンジンでは、照合する言葉を見付けるために「if, and, or but」という論理に沿ったクエリーが必要だった。しかし今のサーチエンジンは複雑なアルゴリズムでデータベース上をくまなく検索し、照合する言葉を高い確率で見つけ出す。

 先の押しピンの例で示したように、物事の複雑さや、より多くのデータを集める必要性は加速的に拡大していく可能性がある。しかし、強力なコンピュータの出現により、推量をベースに説得力のある結果を導き出すのに十分なデータを用意することが可能となった。

 UCLAのJudea Pearlなどの研究者が様々な現象間のある特定の関係だけに的を絞ったベイズモデルの作り方を習得したこともさらに重要だ。それにより計算の数が大幅に減る。

 例えば、全国民を対象とする調査から肺癌の発祥原因を見出そうとすると、肺癌患者は少なく見えるかもしれない。しかし、喫煙者に限定した調査を行えば相関性が見つかるかもしれないし、さらに肺癌患者のみを対象とした調査を行えば、肺癌と生活習慣の間にある因果関係の仮説を立てるヒントを得られるかもしれない。

 「個々の特性や現象は様々な事柄の影響を受け得るが、直接的な影響を与える事柄の数は少ない 」とスタンフォード大学コンピュータサイエンス科のDaphne Koller助教授は言う。「過去約15年の間に各種ツールの機能が飛躍的に向上したため、大きな母数を想定した分析が可能になった」

 Kollerは複数のプロジェクトに関わっているが、中でも症状と病気の照合を向上させるプロジェクトと、遺伝子と特定の細胞の現象を結びつけるプロジェクトに確率論的技術を用いている。

広がりつつある応用例

 関連の手法にHidden Markovモデルと呼ばれるものがある。それは確率論を使って次に起こり得る事象を予測するものだ。例えば、音声認識アプリケーションはアルファベットの「q」の後には最も高い確率で「u」の音が続くことを知覚しており、また「Qagga(絶滅したシマウマの一種)」という言葉が使われる頻度を計算することもできる。

 確率論的手法はMicrosoftの商品にも既に搭載されている。同社のOutlook Mobile Managerはデスクトップコンピュータに届いた電子メールをモバイル機にいつ転送すべきかを決めるソフトウェアで、同社が1998年に発表した試験的システム、Prioritiesが発展したものだ。またWindows XPのトラブルシューティング機能も確率論的計算に依存している。

 MicrosoftのHorvitzによれば、同社のNotification Platformの搭載が進むにつれ、さらに多くの関連アプリケーションが発売される予定だという。

 Notification Platformの主要商品であるCoordinateというアプリケーションは、カレンダー、キーボード、感知カメラなどで集めた情報から個人の生活や習慣のパターンを割り出す。出社時間、昼食の時刻や長さ、保存する(または削除する)電話や電子メールのメッセージの種類、どの時間帯にどの程度キーボードを使っているかなど、幅広い情報が集められる。

 このようなデータはアプリケーションを使用する人物への受信メッセージや他の情報の流れを管理するために使われる。例えばあるマネージャーがある社員のコンピュータに午後2時40分に電子メールを送ったとしよう。Coordinateはその社員のスケジュールを調べ、その人物が午後2時からの会議に出席していることを知る。またCoordinateはこの人物の習慣を調べ、例えば通常は会議開始時間の約1時間後にキーボードをたたき始めることを発見する。さらにこの人物は通常はマネージャーからの電子メールには5分以内に返信していることに気付くかもしれない。これらの全てのデータをもとに、Coordinateはこの人物が少なくとも20分間は席に戻らないことを予測し、マネージャーからのメッセージをこの社員の携帯電話に転送する決断をするのである。同時に、このプログラムは他の人からの電子メールは転送しないと判断するかもしれない、と言った具合だ。

 「我々は受けとる情報の価値とユーザーの作業を中断させる時のコストの間で、バランスをとろうとしている。これらのアプリケーションがあれば、もっと多くの人が情報に溺れることなく物事に対応できるようになるだろう」とHorvitzは言う。

 プライバシーの保護とこれら機能をユーザー自身がコントロールできるということは保障されている、とHorvitzは付け加える。情報発信者はメッセージがどのような理由で優先されたり後回しにされたりしたのかはわからないようになっている。

 その他にも、Microsoft はDeepListener、Quartet、SmartOOF 、TimeWave などのベイズ型の試験的モデルを作成済みだ。一般消費者向けのマルチメディアアプリケーションもベイズ理論の恩恵を受けるだろうとHorvitzは語る。

 ベイズ理論の応用はパーソナルコンピュータの世界に留まるものではない。ロチェスター大学の研究者は、発作の前に人間の歩き方が変化することに着眼、人間の目では見つけにくい微妙な変化をカメラで撮影し、そのデータをPCに送り込んで発作の兆候を見つけることができるとしている。

 同じ原理を利用して、空港でも試験的なセキュリティーカメラが使われている。ほとんどの空港利用者は車を駐車後すぐにターミナルへと移動するので、誰かが駐車後に他の車に向かうという通常のパターンから外れた行動をすると、それを認識し警告を発するのである。ベイズモデルと技術情報を開発する基本的なツールがこの秋にIntelの開発者向けサイトに掲載される予定だ。

各派理論の対立

 簡単に思えるベイズ理論の手法だが、コンピュータ界がこの理論を採用するスピードは遅い。1980年代にスタンフォード大学で確率論と人工知能を専攻して卒業したのはHorvitzを含めて2人だけで、他は「if-then」式の論理の研究をしている学生ばかりだったという。

 「確率論は全く流行らなかった」Horvitzは言う。しかし、if-thenといった論理システムが予期せぬ状況を全て予測できるわけではないとわかるにつれて、流れが変わった。

 また多くの研究者も、人間の決断プロセスはもともと考えていたよりはるかに不可解なものであると認識し始めた。「人工知能の研究者の間には数字を軽んじるような文化的偏見があったが、今では人間の頭の中は理解できないものだと認識している」とKollerは言う。

 ベイズ本人も、自分は本流から外れていると気づいていた。1702年にロンドンで生まれたベイズは長老派教会の牧師となり、生前に自分の論文のうち2つを自ら出版した。しかし彼の最も重要な論文である「Essay Toward Solving a Problem in the Doctrine of Chances(確率論の問題を解く)」はベイズの死から3年後の1764年になって初めて出版されている。

 ベイズが王立団体に属していたかどうかは最近まで謎とされていたが、最近になって見つかった書簡からベイズが当時、英国一流の思想家と個人的に書簡を送り交わしていたことが分かった。

 「私が知る限りでは、ベイズ本人がベイズの定理を書き残したという事実はないはずだ」とHowardはベイズ定理の数式について語る。

 実は、同じ考えで成功者となったのは神学者であるRichard Priceとフランスの数学者Pierre Simon LaPlaceの2人だったのだ。しかし、その考え方も後のブール型数学の祖であるGeorge Booleの考え方に反するものとされた。ブール型数学は代数のような論理に基づくもので、のちに二進法を生み出した考え方だ。Booleもまた王立学会のメンバーで1864年に亡くなっている。

 確率論の重要さを軽んじるものは減ったものの、その応用についての議論はまだ続いている。ベイズモデルは本質的に主観的データに頼っているため、結果の正当性については人間が判断する余地を残すものだという批判が定期的に現れる。また確率論的モデルも人間の思考プロセスの微妙な部分を完全に説明するものではない。

 IBMの調査部門では、統計的手法と論理的手法を組み合わせるCombination Hypothesisという仮説を提唱している。「必ずしも明確になっていないことだが」と同部門のサービスソフトウェア担当バイスプレジデントであるAlfred Spectorは言う。「子供の学習過程は初めのうちは統計的なものだが、ある特定の時点から、例えば3歳位になると統計的な学習だけではないはずだ」

 しかしそれでも、確率論がその地位を確立したことは確かである。

 Horvitzは言う。「確率論は長い間注目されずにきた。しかしこれは推論の基礎なのだ」

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]