ピートゥピーエー(PtoPA)は4月25日、コンテンツごとに特別な言語モデルを作成しなくても、音声認識や音声自動会話などのコンテンツ制作が簡単に行える「言語モデル自動生成技術」を開発したと発表した。
言語モデル自動生成技術は、音声自動会話のコンテンツ(会話シナリオのナレッジベース)から自動的に言語データ(コーパス)を抽出し、それぞれの言葉の認識優先順位を自動的に設定する技術。PtoPAが独自に開発した汎用辞書を利用して、同じ意味でも言い方が異なる多数の言い回しを自動的に言語モデルに生成する。
専門知識や時間と費用を必要とする、手作業による膨大なコーパスの収集や、コンテンツ専用の言語モデルを作成することなしに、手作業で2〜3カ月をかけて作成した言語モデルの80%以上をカバーする自動生成言語モデルを生成することができるという。
PtoPAでは、電話を使った音声での自動FAQや、カーナビ、ロボット、動画や音声を融合させたインタラクティブ映像コンテンツや音声によるEラーニングシステム、ゲームなど、幅広い分野での利用を見込んでいる。
なお、PtoPAでは、同技術を搭載した、人とコンピュータの音声自動会話を実現する汎用プラットフォーム「VOICE CAIWA」を近日中に公開するとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス