> >

グーグル、機械学習システム構築プロジェクトの成果を公表

文：Tom Krazit（CNET News）翻訳校正：湯木進悟、編集部2010年04月07日 10時04分

　Googleは、究極の機械学習システムを構築しようと努めており、その試みから独自の教訓を得ることができた。

　このプロジェクトは、地球外生命体の探索プロジェクトにちなんで「Seti」という開発コード名が付けられており、Googleが「困難な予測問題」と呼ぶ問題を解決するために膨大なデータセットが用いられている。同社は、米国時間4月6日の公式ブログへの投稿で、このプロジェクト名を明らかにしつつ、エンジニアリングの限界を認めた。

　Googleによると、同社の共同創設者であるSergey Brin氏およびLarry Page氏にとって、機械学習は好まれるトピックとなっており、翻訳アルゴリズムや語義の理解の改善を図る上で有用であると考えられているという。しかしながら、当然ではあるが、非常に複雑な概念でもあり、こうしたシステムを利用することができたGoogleのコンピュータ科学者にさえも難題を突きつける存在となっている。

　同システムの設計に当たり、GoogleのSimon Tong氏は、もし同社の研究者に機械学習システムの利用を勧めるつもりならば、たとえ精度を犠牲にしてでも、単純であることに努めねばならないことを学んだと語っている。

　「若干ではあるが精度を落としつつ、利用性やシステムの信頼性を高めるようなアルゴリズムを設計することは、おそらく学問の観点からは多少の興味を失わせるものとなるだろう。とはいえ、経験上は実際のところ非常に貴重な教訓である」と、Tong氏は記している。

　多くの人々は機械学習システムこそが複雑な問題の完全なる解決策であると考えているかもしれないが、時に利用価値よりも多くのトラブルを引き起こしている。Googleの研究部門ディレクターであるPeter Norvig氏は、早くも2008年には、この点で懐疑的な見解を示していた。

　Tong氏は「意義深い多くの利点があるものの、機械学習は一般的に複雑性、不透明性、予測不能性をシステムに増し加える結果をもたらすことを非常に早期から気づいていた。現実的には、進行中のタスクの処理は、時により単純な技術でも十分である」と記した。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。原文へ

CNET Japanの記事を毎朝メールでまとめ読み（無料）