Share on

  • facebook
  • twitter
  • linkedin
対話型ロボットの可能性を広げる、マイクロフォンソリューション
公開日: 2019年9月25日

対話型ロボットの可能性を広げる、マイクロフォンソリューション

ロボティクスとスマートスピーカーなどのAI技術を融合した、対話型ロボットが次々と開発されています。これらのキーテクノロジーとなる音声認識技術は、特定の話し手の音声を周辺ノイズの中から聞き分けるための高性能な小型マイクロフォンが、複数求められます。TDKは、先進の半導体微細加工技術を応用した、超小型のMEMS(Micro Electro Mechanical Systems※1)マイクロフォンを各種ラインナップ。音声認識技術を進化させ、対話型ロボットのさらなるインテリジェント化をサポートします。

対話型ロボットの音声認識に求められる技術課題

人の作業を代替あるいは支援するロボットは、産業用ロボットと業務・サービスロボットに大別されます。近年、成長が著しいのは業務・サービスロボットで、その世界市場規模は2025年には5.75兆円にも達すると予測されています(出典:富士経済『2018ワールドワイドロボット関連市場の現状と将来展望』)。特に、業務・サービスロボットの中でも、対話型ロボットの成長が注目されています。
対話型ロボットは、AIを活用して、人間との対話に自動応対するロボットのことです。対話に応じて動作や言葉を作動させることが可能で、将来予想される、世界的な高齢化社会や労働力不足といった社会課題解決の一翼を担うと期待されています。

業務・サービスロボットの世界市場規模

業務・サービスロボットの世界市場規模

出典:富士経済『2018ワールドワイドロボット関連市場の現状と将来展望』

この対話型ロボットのインタフェースとなるのが“音声認識技術”です。対話型ロボットは、話し手が遠くから話しかけても、その方向を即座に検出し、周辺ノイズの中からも会話を聞き取る必要があります。このため、複数のマイクロフォンを配置して、到達する音声の時間差や強弱などから、話し手の方向を識別して聞き分けます。これは“ビームフォーミング”と呼ばれる技術です。さらに、多方向から来る周辺ノイズも、複数のマイクロフォンを使用した“ノイズキャンセリング”技術(※2)によって、ノイズ成分のみを打ち消すことが求められます。
そのため、ビームフォーミングやノイズキャンセリングを実現するには、マイクロンフォンを可能な限り、小型・軽量化して、複数使用する必要があります。一方で、話し手の音声を正確に聞き取るには、高いS/N比(※3)が要求されます。しかし一般的にS/N比を高めると、高音圧での非線形歪み(※4)が増大してしまいます。小型・軽量でありながら、歪みを抑制しつつ高いS/N比を実現するという課題を、対話側ロボットのマイクロフォンは抱えています。

小型MEMSマイクロフォンによる、音声認識技術ソリューション

ビームフォーミングやノイズキャンセリングの課題を解決するのが、TDKの各種MEMSマイクロフォンです。TDKがInvenSenseブランドで提供しているICS-40730は、4.72 x 3.76 x 3.50mmという小型の高性能MEMSマイクロフォンで、74dBAという高いS/N比を特長としており、ビームフォーミングのためのマイクロフォンアレイ(※5)用として最適です。その上、高S/N比でありながら105dBの音量時でも、歪みを最大0.6% に抑えることができます(電車の通過時のガード下といった、騒がしく感じられるレベルが110dB)。また、ノイズキャンセリング機能にも抜群の威力を発揮します。

MEMSマイクロフォンアレイによるビームフォーミングの例

MEMSマイクロフォンアレイによるビームフォーミングの例
小型で高SN比の高いマイクロフォンをアレイ化することにより、複数の音源の中から特定の音源を分離したり、音声を強調することも可能になるビームフォーミング技術が実現します。

さらにICS-40730以外にも、TDKは用途に応じたMEMSマイクロフォンを豊富にラインアップ。対話型ロボットや高級車などに搭載される音声認識インタフェースのほか、スマートフォンやノートPC、タブレット、ウェアラブル機器、補聴器などにも利用されています。これらは、TDKのコアテクノロジーであるMEMS技術を駆使した音響センサであるMEMSマイクロフォン素子と、信号処理などを行うASIC(特定用途向けの半導体集積回路)を同一パッケージに格納することで実現しました。

ロボット化するクルマにおけるMEMSマイクロフォン

ロボット化するクルマにおけるMEMSマイクロフォン
MEMSマイクロフォンによる音声認識インタフェースを備えたクルマ。クルマがロボット化して会話する時代が到来しており、自動運転技術でもキーテクノロジーになると予想されます。

ロボットは、より人間に近いヒューマノイド型へと進化しつつあります。ヒューマノイド型ロボットでは、人間に近い動きを実現するため、手足の関節や体の姿勢制御などにも、多数のセンサが搭載されます。TDKではMEMSマイクロフォンをはじめとする各種MEMSセンサのほか、半導体技術や薄膜技術、磁性技術を応用した角度・位置センサ、電子セラミックス技術を応用した温度・圧力センサなど、多種多様なセンサを先進のソフトウェアとともに提供して、ロボティクスの発展をサポートしています。

ヒューマノイド型ロボットに搭載されるTDKセンサ

ヒューマノイド型ロボットに搭載されるTDKセンサ

MEMSマイクロフォン「ICS-40730」

MEMSマイクロフォン「ICS-40730」
ICS-40730は、超低ノイズ、差動アナログ出力、ボトムポート型MEMSマイクロフォンです。 74dB SNRと±2dB感度許容度は、マイクロフォンアレイおよびボイスコマンドといったアプリケーションに最適です。詳細はプロダクトセンターをご覧ください。
Product Center

用語解説

  1. MEMS(Micro Electro Mechanical Systems)技術は、半導体集積回路の製造技術を利用して、シリコン基板などに、微細なセンサや可動機構などを作り込むマイクロマシニング技術。
  2. ノイズキャンセリング技術とは、ノイズ波形と逆位相の音波を足し合わせてノイズ成分のみを打ち消す技術。ヘッドセットやスマートフォンなどにも採用されている。
  3. S/N比とは、信号に対するノイズ(雑音)の量を対数で表したもので、数値が大きいほど雑音が少なく高品質の信号が得られることを意味する。
  4. 非線形歪みとは、電子機器において、入出力量との間に比例関係がないときに現れる歪み。全高調波歪み(歪率、THD/total harmonic distortion)などの指標を使用する。
  5. アレイ化とは、主に高密度化を目的に、複数の部品を配置すること。
製品に関するお問い合わせ
  • facebook
  • twitter
  • linkedin
トピックス 記事一覧

PAGE TOP