※本記事は、DSP Concepts社のエンジニアが作成したブログをマクニカで和訳したものになります。
全二重 (full-duplex) 通信では、回線の両端にいる人が互いに干渉することなく話したり聞いたりできます。イーサネット接続を使用している場合でも、古いアナログ電話回線を使用している場合でも、全二重通信のテクノロジーは十分に確立されており、スピーカーフォンを接続するまでは何十年にもわたって実証されています。
標準的なスマートフォンでは、全二重通信での干渉は問題になりません。音声は電話のマイクに入り、携帯電話会社を経由して、電話のスピーカーから直接相手の耳に入ります。電話のマイクはスピーカーからの音声をほとんど拾わないため、干渉の心配はありません。相手の声が音声に干渉することはなく、その逆も同様です。
スピーカーフォンまたはビデオバー、会議室のディスプレイ、ビデオ画面付きのスマートスピーカーなど、会議に使用されるその他のデバイスでは、マイクはスピーカーを「聞く」ことができます。そのため、マイクはユーザーの声を拾うだけでなく、スピーカーから入ってくる回線の相手 (“POOL”と呼びます) の声も拾います。会議デバイスは、相手の声を少し遅延させ、位相を反転させたバージョンをマイク信号とブレンドして、スピーカーからマイクに直接入力される音声をキャンセルすることで、問題をある程度解決できます。
しかし、スピーカーから出て、部屋の中で反射し、マイクに入る音はどうでしょうか?この音は、部屋の大きさにもよりますが、数msから100ms以上の遅延があるエコーなので、キャンセルするのが、はるかに困難になります。もちろん、残響の多い空間であればあるほど、音が何度もマイクに反射する可能性が高くなります。また、音がマイクに戻るまでに、そのスペクトルコンテンツは空間の音響によって変更されているため、キャンセルするのが困難になります。
マイクからの信号を処理してこれらのエコーを除去する効果的な方法がなければ、相手の声は予測できない方法で自分の声と混ざり、音を妨げ、不明瞭でしばしば理解できない結果になります。
解決策は、これらのエコーをキャンセルすることです。しかし、それは簡単ではありません。デジタル信号プロセッサーは、マイクに入ってくる音 (自分の声) と、欲しくない音 (POOLの声のエコー) を区別しなければなりません。これをおこなうには、電話の相手からの元の信号の性質を分析し、マイクから入ってくる音を分析して、それが自分の声なのかPOOLの声のエコーなのかを判断します。
高品質の会議デバイスは通常、ピックアップパターンを「操作」するために3つまたは4つのマイクをアレイで使用することを考えると、問題はさらに難しくなります。POOLの音声のエコーは、わずかに異なる時間と振幅でこれらのマイクに到達します。そのため、デジタルシグナルプロセッサーは、1つだけではなく、4つの入力を分析および修正する必要があります。
全二重音声会議で発生する問題については、DSP Concepts社が公開している動画がありますので、ご興味のある方は以下をご覧ください。
おすすめ関連記事
お問い合わせ
全二重音声会議の課題とソリューションおよび音声アプリケーションのデジタル信号処理に関するその他の多くの問題についてご質問などある方は以下よりお問い合わせください。
DSP Concepts メーカー情報Topへ
DSP Conceptsメーカー情報Topページへ戻りたい方は、以下をクリックください。