logo

OKI、アンビエントボイスサプレッサ(AVS)搭載の「小型音源分離マイクモジュール」を開発

騒音下でのクリアなコミュニケーションを実現

Tokyo, Nov 21, 2012 - ( JCN Newswire ) - OKIは、このたび大雑音下でも利用者の発声区間を正確に抽出し、雑音を抑圧するアンビエントボイスサプレッサ(以下AVS)技術を開発しました。さらにAVSを搭載した「小型音源分離マイクモジュール」を製作し、利用者の声を分離抽出する性能を大幅に向上させることに成功しました。本技術は周囲の雑音から利用者の声のみを分離・抽出できるため、スマートフォンなどのモバイル機器に搭載することで、展示会場、車中、駅などの騒がしい場所でも支障無くコミュニケーションができます。

近年、スマートフォンが急速に普及し、従来の通話に加えて、テレビ電話機能などのハンズフリーで音声通話を行う場合が多くなってきています。騒音が多い屋外の公共空間などでハンズフリー通話を行うと、周囲の人の話し声や環境雑音の混入によって通話音質の低下や、ハウリングが起こりやすくなる、という課題があります。

このような課題に対処するため、OKIは長年に亘る音源分離※1の研究開発をベースに、複数マイクを用いて周囲の人の話し声や背景雑音を抑圧するAVS技術を開発しました。さらに製作したAVS搭載の「小型音源分離マイクモジュール」を用いた検証実験では、騒音レベルの高いバスターミナルや駅のホームでクリアに会話ができることを確認しました。

今後、OKIはAVSを搭載した音源分離ソフトウェア及び「小型音源分離マイクモジュール」の情報通信機器市場への展開や、さらなる応用に取り組んでいきます。

なお、本開発の一部は、早稲田大学・小林哲則 教授との共同開発によるものです。

【AVS(Ambient Voice Suppressor)技術の概要】

AVSは、周囲の人の話し声と話者本人の声とを判別し、周囲の人の声のみを抑圧するOKIの独自技術です。入力音の到来方位を判定し、正面以外から到来する入力信号 (隣の人の話し声や背景雑音など)を抑圧するという処理を行います。

到来方位の判定は、指向性形成フィルタで生成した4方向の指向性信号の相互相関※2に基づいて行います。相互相関は、正面から入力信号が到来していると大きくなり、そうでない場合には小さくなります。そこで、相互相関が小さい場合は話者の声ではないとみなして抑圧します。このようにして正面から到来する音声成分を抽出できます。

この機能により、従来は困難だった話者本人の声と隣で話している人の声とを正確に判別し、話者の声を抽出することが可能になりました。バスターミナル(騒音レベル60~70dBA)や鉄道の駅のホーム(騒音レベル60~85dBA)で検出性能評価を実施したところ、正確に目的音声区間を検出できていることが確認できました。

また、今回製作したAVS搭載「小型音源分離マイクモジュール」では、AVSの到来方位判定機能を応用して、モジュールに搭載されている4個のマイクの感度差を自動校正する機能も同時に稼動しています。この機能により、マイクの感度差によって生じる音質低下を防止できるようになり、話者の声の音質がさらに自然になりました。またマイク特性の経年変化が起きても、音質や抽出性能の変化を防ぐことができます。

【AVS搭載「小型音源分離マイクモジュール」の特長】

1.音声通話時の通話音質の向上
雑音下で会話している場合でも、通話相手には背景雑音や周囲の話し声が抑圧されたクリアな声が届くようになります。また大雑音下でハンズフリー通話を行う場合、音の回り込みによってハウリングが発生しやすくなりますが、AVSで回り込み成分を抑圧できます。これによりハウリングが発生しにくく安定した通話が可能になります。

本技術はスマートフォンなどの携帯端末に限らず、ビデオ会議システム・インターホンなど、音声通話機能を有する機器においても有効です。またATMや券売機の通話マイクとしても適用可能です。

2.音声認識技術※3の誤認識を防止
近年、スマートフォンやカーナビゲーションシステムには音声認識技術を用いた音声検索機能が搭載されるようになってきています。音声認識技術は騒がしい場所で使用した場合、誤って話者以外の人の話し声に反応してしまう場合があります。本モジュールを用いることで周囲の話し声が抑圧され、誤認識を防止できます。

【AVS搭載「小型音源分離マイクモジュール」のサンプル仕様】

項目: 仕様

概要
- マイク: MEMSマイク 4個
- ADコンバータ: 16bit (標本化周波数 16kHz )
- DAコンバータ: 16bit
- 電源電圧: DC 5V
- 消費電流: 130mA
- 外形(mm): 45(W)×70(H)×9(D) (基板サイズ:部品厚含まず)
- 電源コネクタ: 2極2mmピッチ
音響特性
- マイク周波数特性: 200Hz ~ 7.2kHz
- 指向性: 図2参照
音響信号出力 インターフェース
- ディジタル: USB (type mini-B メス)
- アナログ: 3極ミニチュアジャック(L側のみ出力)

本リリースの詳細は下記URLをご参照ください。
リンク

【用語解説】
※1. 音源分離
複数の音源や各種環境音が混ざり合った状況から、目的とする音源のみを抽出する技術。

※2. 相互相関
複数の信号の類似性を表す特徴量。

※3. 音声認識技術
人が話した言葉を解析し、発話内容を文字データ化する技術のこと。

概要:沖電気工業株式会社

OKIは米国でグラハム・ベルが電話機を発明したわずか5年後の1881年に創業した、日本で最初に電話機を製造した情報通信機器メーカーです。先見性と勇気をもって果敢に挑戦・行動するという、創業以来の「進取の精神」を連綿と受け継ぎ、ブランドスローガン「Open up your dreams」のもと事業展開しています。現在、「金融システム」「通信システム」「情報システム」「プリンタ」「電子部品・モジュール他」の5つの分野において、OKIグループは社会の発展に寄与する最先端技術の商品・サービスをお客様にお届けし、世界の人々の快適で豊かな生活の実現に貢献しています。詳細はこちらからご覧ください。 リンク

お問合せ先:
本件に関する報道機関からのお問い合わせ先
広報部 葛 
電話: 03-3501-3835
e-mail: press@oki.com

本件に関するお客様からのお問い合わせ先
研究開発センタ メディア処理技術研究開発部
お問い合わせフォーム URL: リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。