KDDI総合研究所は7月25日、日本語音声合成ソフトウェア「N2」をベースに、組み込みシステム向けマイクロコントローラ(マイコン)上で、HMM音声合成方式を用いた省リソースかつ高品質な日本語テキスト音声合成を実現したと発表した。
音声合成処理に利用するデータを小型フラッシュメモリに適した構造にすることで、高速な処理を実現する独自のデータ処理技術を利用。これにより小型のIoT機器などでも、自由な音声応答が可能だという。
N2は、同社が独自に開発した省メモリで軽量な日本語音声読み上げソフトウェア。音声読み上げ機能利用時に、携帯電話回線などのネットワーク接続が不要であるため、端末単体で動作可能という特徴がある。これまでは、携帯端末で動作するauの「おはなしアシスタント」で利用されているという。さらに、KDDIの「クラウドオートコール」での音声メッセージの合成など、サーバシステムでも利用されている。
同社では、今回の成果を含むマイコンシステム向けN2のライセンス提供を開始。あわせて、IoT機器のプロトタイプ開発向けにN2のLinux無償版(インストール後30日間の利用期限あり)の提供も開始する。Linux無償版では、Raspberry Piなどの小型マイコンボードでも、日本語プレーンテキストの読み上げ音声をWAV(PCM)形式で出力できるほか、インストールやアップデート、アンインストールも簡単にできるという。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」