MIT、「失われた言語」を機械学習で復活させる取り組み

Shelby Brown (CNET News) 翻訳校正: 編集部2020年10月27日 07時30分

 マサチューセッツ工科大学(MIT)のコンピュータ科学・人工知能研究所(CSAIL)の研究チームは、機械学習を用いて、死に絶えた言語に新たな命を吹き込もうとしている。同チームが開発した新システムは、今となっては理解不能な失われた言語を自動的に解読できる。しかも、例えばギリシャ語やヘブライ語など、他の言語の古語との関係性についての知識なしでの解読が可能だ。

MITのツールは、エジプトの象形文字だけでなく多数の失われた言語を解析する
MITのツールは、エジプトの象形文字だけでなく多数の失われた言語を解析する。
提供:Abdelrahman Hassanein/Getty Images

 多数の言語が、その言語で記述されたテキストを理解するために必要な文法、語彙、構文についての情報が不十分なために、失われたとみなされている。

 MITは10月21日の発表の中で、「失われた言語は学術上の関心事というだけではない。言語が分からなければ、その言語を使っていた人々についての知識すべてを失うのだから」と述べた。

 MITの博士課程の学生、Jiaming Luo氏がRegina Barzilay教授とともにこのシステムを構築した。このシステムは、これまで言語が進化してきた法則などに基づくアルゴリズムを採用している。このアルゴリズムは、言葉が変化するパターンを検出することにより、古語の言葉を、関連する言語の言葉に当てはめることができる。また、2つの言語の近似性も評価できる。さらに、既知の言語でテストすると、語族(訳注:同一の起源から派生・発達したと認められる同系統の言語)を識別することもできる。

 研究チームは今後、関連する既知の言語がない場合でも、その意味を識別できるようにしたいと考えている。最終的には、数千個の単語だけで失われた言語を解読することを目指している。

 「私たちは、言語が動物の種のようなものであることに考えをめぐらせることは少ない」とLuo氏は述べ、「それらは進化し成長できるが、衰退し絶滅することもある」とした。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]