logo

「ベンチャーだからこそできる」--1チップの音声合成LSIは新市場を切り開けるか

  • このエントリーをはてなブックマークに追加

 アクト・ブレインは5月、音声合成に必要な機能を1チップに集約したシステムLSI「MICRO TALK」を開発した。対応ソフトウェアに文章を入力すると、自然な発話で読み上げるというものだ。1チップ化により小型機器でも搭載可能なことから、家電から業務用機器まで幅広く採用を呼びかける。

 音声合成LSIという製品は従来から存在するが、そのほとんどはあらかじめ決まった音声を録音し、必要に応じて任意の音声を再生するというものであった。MICRO TALKは任意の文章を読み上げられる点が最大の特徴。事前の音声録音の必要がなく、音声保存用のROMも不要だ。

アクエストの山崎信英氏とアクト・ブレインの山崎明宏氏。 アクエストの山崎氏(左)とアクト・ブレインの山崎氏(右)。2人が高等専門学校時代の同級生だったことがきっかけでMICRO TALKが生まれた

 「従来の音声合成エンジンでは、長い文章や複数の文章を保存するためにはROMの容量を大きくしなければならず、基盤サイズが大きくなってしまいます。また、その分コストもかかります。さらには、新しい言葉を追加するには同じ声の人を呼んでもう1度言葉を吹き込んでもらう必要がありました」(アクト・ブレイン代表取締役の山崎明宏氏)

 MICRO TALKで利用している音声合成エンジン「AquesTalk」は、アクエストが開発した。これは2006年に開発が終了したもので、組み込み用途向けに開発された。他社製品に比べてプログラムが小さいため、1チップに搭載できたという。現在は同社のウェブサイトで公開しており、Windows版は無償で提供している。「Windows版でAquesTalkをまずは試してもらい、組み込み製品で収益を上げていく」(アクエスト代表取締役社長の山崎信英氏)

 MICRO TALKで音声を合成するためには、読み上げたい文章を専用ソフトにひらがなやカタカナ、数字で入力する。漢字やカナ混じりの文章を入力できればさらに使い勝手を高められるが、そのためには漢字とよみがなを対応させるための辞書を搭載する必要があるため1チップに収まらないことから、採用は見送られたという。

 数字を桁のついた数値として読み上げる場合や、文章にアクセントをつけたい場合には、文章や数字に特定の記号を加える。再生する音声は8種類用意されており、再生速度も柔軟に変更可能だ。

サンプル基盤 MICRO TALKを搭載したサンプル基盤。スピーカーから合成音声が流れる

-PR-企画特集