報道機関向けのニュース速報サービス「Spectee」を運営するSpecteeは11月7日、人間に近い音声で原稿を読み上げたり、会話したりできるAIアナウンサー「荒木 ゆい」のベータ版を公開したと発表した。
実際にアナウンサーが読んでいる約10万件のニュース音声を、同社が開発した人工知能エンジン「Spectee AI」で機械学習したことで、さまざまなニュースのシーンにおけるより人に近い自然な発音、アクセントやイントネーションを習得し、自動で原稿を読み上げるバーチャルアナウンサーを開発したという。会話エンジンにIBMの人工知能「ワトソン」の技術を一部使用しているほか、音声エンジンにHOYAの「VoiceText」の技術を一部使用している。
正しく自然に読み上げるだけでなく、日本のさまざまな難読地名や同形異音語(同じ表記でも読みが異なる語)の読み上げ、読み分けも可能だという。たとえば、東京と大阪に存在する「日本橋」について、東京では「ニホンバシ」、大阪は「ニッポンバシ」と読むが、AIアナウンサーでは、文脈からどちらの「日本橋」について言及しているかを判断して読み分けるとのこと。
さらに、会話にも対応。相手の質問内容を理解して応答する機能を備えているという。現在は簡単な会話応答のみの対応だが、将来的にはニュースの当事者に対してインタビューを行うことができるように開発を進めているという。
同社はSpecteeを通じて、2017年5月に音声による自動読み上げ機能を実装したほか、自動でニュース記事を作成するAI技術も併せて開発。自動でニュース関連情報を収集し、記事を作成、読み上げまで行うことで、一気通貫でニュースを制作できる技術の開発を進めている。これらの技術によって、報道現場のコスト削減に繋げられるほか、たとえば災害時の長時間放送をAIアナウンサーが担当することで、休むことなくニュースを配信できるとしている。
AIアナウンサーはニュースだけでなく、ドキュメンタリーやバラエティ番組のナレーション、劇場や美術館などの館内放送、観光案内、結婚式やその他式典での司会など、さまざまなシーンでの活用を見込んでいるという。なお、12月末までは法人企業向けに無償で提供するとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」