ソースネクストは12月9日、AIボイスレコーダー「AutoMemo」シリーズの新製品として、「AutoMemo(オートメモ) S」(税込:2万4800円)を2022年1月21日に発売すると発表した。
名刺サイズで、重さは88g。録音の状況、文字起こしの結果などを本体で確認できる2.83インチの大画面フルカラー・タッチパネル・ディスプレイを搭載した。なお、文字起こしは、日本語、英語、中国語のほか、計72言語に対応する。翻訳機能はなく、一度の録音でテキスト化できるのは1言語のみ。
なお、録音データはWi-Fiでクラウドに保存される。保存件数や期間に制限はなく、容量が足りるかどうかを気にする必要はない。
新たな音声認識エンジンを採用したことで、AIによる音声認識が進化。文字起こしの精度が大幅に改善したという。自然な位置に「、」や「。」が入るため、文字起こし後のテキストが読みやすいのが特長だ。同社のテストでは、旧エンジンと比べて文字起こしの正確さが15%向上したとしている。
なお、新エンジンは12月16日から提供予定で、従来モデルのAutoMemo利用者にも適用される。なお、クラウド上で完結するため、本体のアップデートは不要だ。
文字起こしをするには、クラウドサービスを介す必要がある。購入時は毎月1時間まで無料でテキスト化を試せるベーシックプランになっている。使い方にあわせて、毎月30時間までテキスト化できる「プレミアムプラン」(税込980円)、使用期限なしで10時間までテキスト化できる「10時間チャージ」(10時間ごとに税込1480円)をラインアップする。
このほか、2022年1月(予定)より、翻訳ツール「POCKETALK(ポケトーク)」ブランドの新製品として、PCソフト「ポケトーク字幕」(Windows/Mac)」を発表した。これまで同社が提供してきたポケトーク本体なしに利用できるのが特長だ。
ZoomやTeamsなどのリモート会議システム上で、PCのスペースキーを押しながら話すと、自分が話した言葉を指定した最大2言語に翻訳し、瞬時に字幕でカメラ映像に合成して表示する。翻訳速度は、他社の一般的な自動翻訳サービスと比べて、3.2倍以上速く翻訳・表示(同社調べ)できるという。82言語に対応する。
ウェブカメラの画像と翻訳結果を字幕のように画像合成し、仮想カメラとして動くため、理論上リモート会議システムはもちろん、Facebook Messengerのビデオ通話、YouTubeのストリーミング配信等、ウェブカメラを使った映像であれば何でも表示ができるという。
Windows版は1月から、Mac版は2月より提供予定で、3月末まで無料配布する。4月(予定)よりWindows、Macともに有料化し、価格は月額1100円(税込)または年額1万3200円(税込)で提供予定だ。
最近では、「Google Pixel 6 Pro」のように高性能ながら無料で利用できる翻訳やテキスト化できる機能を搭載したスマートフォンも登場している。
これらに対する優位性について、ソースネクスト 代表取締役会長 兼 CEOの松田憲幸氏は、「いままでも無料で使える端末はあり、ポケトークが後発。スマートフォンが必要になる場合、個人で使う分にはいいが、法人で翻訳機が必要になったときに、個人のものを使ってくださいとはいえない。そのために新たなスマホを買い与えることになるが、2万9800円では買えないので、価格面でも優位性がある」と説明した。
なお、ポケトークは翻訳機としては米国初のHIPAA(Health Insurance Portability and Accountability Act of 1996)に準拠した製品となる。患者の健康に関する情報が同意や知識なしに開示されないように保護するための国家基準の策定を義務づけたもので、それを期に医療機関や教育現場などで活用され始めたという。
コロナ禍において、病院やワクチン接種などで利用されており、米国におけるポケトークの売上高は前年比7.6倍になったとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」