フォトレポート:「NTT CS研オープンハウス×未来想論2009」--新型インフルの影響で完全オンラインイベントに - 4/7

板倉一也(編集部)2009年06月03日 20時37分
「隠れた単語を発見する」

 単語ごとに「スペース」を入れて表記しない日本語は、一般的にその内容を機械的に分析することが、英語などと比べて難しいとされる。そのため、文章の中から意味を持つ単語を選び出す「形態素解析」を行う場合、一般的にはあらかじめ用意された辞書との照合を行う方式などが使われている。しかし、この方式ではブログなどで次々と生み出される新語などへの柔軟な対応が難しい。この研究ではベイズ統計モデルを用いることによって、前もって辞書を準備しなくても、大量の文章に対する統計的な分析から、自動的に単語を発見し、分割を行うことができることを目指す。検索エンジンや機械翻訳の精度向上に貢献する可能性がある研究だ。
Scroll Right Scroll Left

「隠れた単語を発見する」

 単語ごとに「スペース」を入れて表記しない日本語は、一般的にその内容を機械的に分析することが、英語などと比べて難しいとされる。そのため、文章の中から意味を持つ単語を選び出す「形態素解析」を行う場合、一般的にはあらかじめ用意された辞書との照合を行う方式などが使われている。しかし、この方式ではブログなどで次々と生み出される新語などへの柔軟な対応が難しい。この研究ではベイズ統計モデルを用いることによって、前もって辞書を準備しなくても、大量の文章に対する統計的な分析から、自動的に単語を発見し、分割を行うことができることを目指す。検索エンジンや機械翻訳の精度向上に貢献する可能性がある研究だ。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]