オトバンク、PKSHAとAI音声合成サービス「カタリテ」を開発--実証実験を開始

 オトバンクは7月14日、PKSHA Technology(PKSHA)の音声関連技術をもとに、独自のAI音声合成サービス「カタリテ」を開発したと発表。PKSHAが開発した自然な発音を再現するアクセント推定技術「tdmelodic」を初めて実用化したもので、日経電子版と連携し、活字コンテンツの音声化に関する実証実験を行う。

 このサービスでは、PKSHAによる最先端の音声合成技術に、オトバンクの保有するオーディオブック音声データベースを学習させることで実現したAI音声合成サービス。音声合成技術の活用により、収録から編集に必要な制作時間を短縮。即時性の高いコンテンツも、適時に音声化し提供できる環境の実現を目指す。

 PKSHAが開発した音声合成プラットフォーム「PKSHA Phonetics(フォネティクス)」を採用。また、tdmelodicなどにより、一般的な音声合成ソフトウェアでは難しいアクセントの制御が可能。さらにオトバンクのオーディオブックディレクターがチューニングを実施することで、より自然で聴き心地のいい音声を実現しているという。語り手(朗読者)には、声優の浅野真澄さんを起用。落ち着いた安定感のある声で音声化されるとしている。

音声合成サービス「カタリテ」
音声合成サービス「カタリテ」

 実証実験は、7月14日から日経電子版の速報コーナーで配信された記事の一部を抽出し、その見出しから生成した音声コンテンツを、オトバンクが運営する「audiobook.jp」の聴き放題プランにて配信する。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]