マサチューセッツ工科大学(MIT)のコンピュータ科学・人工知能研究所(CSAIL)の研究チームは、機械学習を用いて、死に絶えた言語に新たな命を吹き込もうとしている。同チームが開発した新システムは、今となっては理解不能な失われた言語を自動的に解読できる。しかも、例えばギリシャ語やヘブライ語など、他の言語の古語との関係性についての知識なしでの解読が可能だ。
多数の言語が、その言語で記述されたテキストを理解するために必要な文法、語彙、構文についての情報が不十分なために、失われたとみなされている。
MITは10月21日の発表の中で、「失われた言語は学術上の関心事というだけではない。言語が分からなければ、その言語を使っていた人々についての知識すべてを失うのだから」と述べた。
MITの博士課程の学生、Jiaming Luo氏がRegina Barzilay教授とともにこのシステムを構築した。このシステムは、これまで言語が進化してきた法則などに基づくアルゴリズムを採用している。このアルゴリズムは、言葉が変化するパターンを検出することにより、古語の言葉を、関連する言語の言葉に当てはめることができる。また、2つの言語の近似性も評価できる。さらに、既知の言語でテストすると、語族(訳注:同一の起源から派生・発達したと認められる同系統の言語)を識別することもできる。
研究チームは今後、関連する既知の言語がない場合でも、その意味を識別できるようにしたいと考えている。最終的には、数千個の単語だけで失われた言語を解読することを目指している。
「私たちは、言語が動物の種のようなものであることに考えをめぐらせることは少ない」とLuo氏は述べ、「それらは進化し成長できるが、衰退し絶滅することもある」とした。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」