Googleの「Live Transcribe(音声文字変換)」アプリに音事象を表示する機能が加わる。Googleによると、聴覚障害者が音の世界をもっと楽しむのに役立つという。
Googleの機械学習および音声認識技術のアップデートにより、Live Transcribeは会話だけでなく、犬のほえる声やドアをノックする音、拍手、笑い声、音楽、ホイッスル、通りすぎる車などの音も文字化できるようになる。
Live Transcribeは、「Sound Amplifier(音声増幅)」とともに2月にリリースされた。Live TranscribeとSound Amplifierはいずれも、聴覚障害者がより簡単にコミュニケーションできるようにする狙いがある。
Live Transcribeは、スマートフォンのマイクを通じて会話を捕捉し、その内容をディスプレイに自動表示する。
Googleで機械学習の公正とアクセシビリティエンジニアリングを担当するグループを率いるEve Andersson氏は、1月に「テクノロジーは、インクルーシブな社会を実現し、さまざまに異なった能力を持つあらゆる人々の力になるために存在する」と語っている。
Live Transcribeでは、文字化した内容のコピーや保存も可能になる。会話の内容は、「Android」端末にローカルで3日間保存される。
アクセシビリティについては、音声を視覚化するインジケーターのサイズも拡大される。
アップデートは6月に提供予定だ。
Googleは米国時間5月15日、「Translatotron」という「実験的な新システム」も発表した。音声を直接音声に翻訳するため、文字を介する必要がなくなるという。
つまり、翻訳にかかる時間が短くなり、複合的な誤りが減ることになる。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス