Microsoftの人工知能(AI)研究部門、Microsoft AI and Research Groupが、会話で使われる言葉をほとんどの人間と同程度の正確性で聞き取れる音声認識システムを作り上げた。
この画期的な技術は、研究チームが「ヒューマンパリティ」(人間と同等であること)と呼ぶ基準を達成した。つまり、完璧ではないものの、誤りの数が人間のプロの筆記者と同等か、それよりも少ないということだ。このシステムの単語誤り率は、2016年9月に報告されたばかりの6.3%から、さらに5.9%まで減少している。
これは話を聞いて受ける印象以上に、目覚ましい進歩と言える。人間でも、書き起こしの際に「have」と「is」、あるいは「a」と「the」を聞き違えるのはよくあることだ。これが実質的に意味するのは、コンピュータが史上初めて、会話の中で使われる言葉を人間と同等の正確さで認識可能になったということだ。
このシステムは、ニューラルネットワークを用いて膨大な量のデータを処理し、より多くの情報に触れることで、パターン認識を学んでいくという。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」