OEMの要求を実現するには、SoCやCPUといった従来のICでは難しくなってきた
オーディオ、空調、カーナビといった “車載製品での音声操作” が、高級車で実現されてきています。
車内において、ハンドルなどから手を放さず、デバイスを操作できるのは非常に便利です。今後、高級車以外への導入も求められていくのではないかと考えています。
音声操作の実現を考えたとき、SoCやマイコンといった従来のICでの対応を考えるのが一般的でしょう。音声操作専用のSoCは市場に出回りつつあります。
しかし、従来のICのみで実現するより “FPGA” と処理を分散した方が、メリットがあることはご存じでしょうか。
今回の記事では、「車載製品における、音声操作の実現」 において、“FPGA” が有効となる場面をご紹介します。
ぜひ、FPGAの有効性を知ったうえで、“FPGAの導入” も検討材料の一つとしてお持ちください。
車載製品の音声操作実現に求められる、性能とFPGAの有効性
音声操作実現までの流れと、FPGAが有効な場面
まずは、音声操作を実現するにあたっての流れと、 “FPGA” がどの過程で有効なのかをご紹介します。
音声操作を実現するには、大きく分けて次の “4つの過程” が求められます。
1.マイクにより人の声を音声信号に変える(入力)
2.音声信号が音声認識に必要な情報のみになるよう、フィルター処理をおこなう(前処理)
3.フィルター処理した音声信号の内容をもとに、操作対象の車載製品とそれに対する出力値を決める(分析)
4.操作対象の車載製品に出力値を送り、音声操作を実行する(出力)
1~4 の過程の中で、音声操作を担う IC が 「2. 前処理」「3. 分析」をおこなうことが一般的です。
しかし、車内という特殊な環境では、 「2. 前処理」の段階で求められる性能が多数あり、音声操作を担うICだけではスペックが足りなくなる可能性が考えられます。
もちろん、“高スペックなIC” を導入すれば解決はできますが、“コストや消費電力” の増加が課題となり難しいでしょう。
そこで、マクニカでおすすめしているのが、 「2. 前処理」の過程を “FPGA” に分散するという方法です。 FPGAの特長から 「2. 前処理」で求められる性能は、FPGAが得意と
するものが多いです。音声操作を担うICで対応するよりも、コストも消費電力も抑えられる可能性があります。
音声操作の前処理で求められる、4つの性能とFPGAの有効性
次からは、「2. 前処理」の段階で求められる “主な性能4つ” と、それら実現における “課題”、“FPGAのメリット” をご紹介します。
求められる性能 [1] 4つ以上のマイクへの対応
車内で音声操作を実現するにあたり、すべての座席から声を拾えるよう、各座席に収音用のマイクが設置されるようになると考えます。座席数と同じ4つ以上のマイクへの
対応が求められるでしょう。
収音マイクの数が増えれば、インターフェースの数もマイクの数だけ必要になります。しかしながら、従来の IC はステレオに対応できれば十分だったため、“インターフェースの数” が
2つまでしかないことがほとんどです。そのため、インターフェースの数が足りないことが “課題”となるでしょう。
また、収音マイクが増えれば、それぞれのマイクから送られてくる音声信号に対しての並列処理も求められますが、従来の IC では複数の音声信号入力に対応していない。
対応できても処理時間や、レイテンシーが増加するといった点が “課題”になりやすいと考えます。
一方、“FPGA” なら回路データを後からでも書き換えられますので、インターフェースの数をマイクの数に合わせて増やすことが可能です。
また、“FPGA” はハードウェアデバイスであるため、並列処理も素早くおこなえます。
求められる性能 [2] ビームフォーミングへの対応
“ビームフォーミング” とは、特定の方向からの音声だけを受信する技術のことです。
最初に音声を拾ったマイクを認識することで、どの座席のマイクから収音すべきかを瞬時に判断します。必要のないマイクを切り、一つのマイク、一つの座席からの音声だけに集中して処理するために必要ですので、音声操作の実現には欠かせない技術です。
ビームフォーミングを実現するには、マイクから送られてくる複数の音声信号にリアルタイムに素早く対応する必要があります。つまり、IC には “素早い並列処理” が求められます。
しかしながら、前述の通り “従来のIC” では複数の音声信号入力に対応していない、対応できても処理時間や、レイテンシーが増加するといった点が “課題” になりやすいでしょう。
一方、“FPGA” ならハードウェアデバイスで並列処理に強く、複数の音声にリアルタイムに素早く対応できます。
求められる性能 [3] ノイズキャンセリングへの対応
“車内” は、ロードノイズなどもあり、雑音が非常に多い環境です。正確な音声操作を可能にするという目的からも、“ノイズキャンセリング機能” が求められていくのではないかと
予想しています。ちなみに、ノイズキャンセリングとは、マイクで車内の雑音を拾って分析し、雑音を打ち消す音をスピーカーから再生することで、“車内を静かにする” 技術です。
このようなノイズキャンセリングを実現するには、ノイズキャンセリング用のマイク、スピーカーが必要になります。また、雑音を打ち消す音を瞬時につくりだす必要がありますので、
リアルタイムでの音声処理が何よりも重要です。ノイズキャンセリング専用のICを使えば、リアルタイム性は問題ないでしょう。
ただし、“FPGA” ならノイズキャンセリングを実現しながら、ビームフォーミングなどの “その他の機能” にも対応することが可能です。
さらに、さまざまなインターフェースにも対応できるため、 “多種多様” なマイク・スピーカーへ接続できます。
求められる性能 [4] デバイス変更への柔軟な対応
“前処理” における “FPGA” のメリットは、ご理解いただけたのではないでしょうか。
上記内容に追加して、音声操作用の入力マイクの種類、出力先の車載製品が変わっても、“同じFPGAを使い回せる” というのも大きなメリットです。
今まで説明してきた通り、“FPGA” は“後からでも回路データを書き換えられる” という特長を持っています。インターフェースの数・種類に柔軟に対応できるため、開発途中での仕様変更、モデルチェンジにより搭載されるマイクや車載製品の数・種類が変更になったとしても、回路データを書き換えることで柔軟に対応できます。
“開発にかかる工数” を抑えられるのはもちろん、同じFPGAを使い回すことで “基板開発・改変の頻度” を抑えられるため、長期で見た時のコストカットも期待できます。
FPGAの導入方法
車載製品における “音声操作” 実現に、“FPGA” がどう有効かご理解いただけたと思います。
しかし、FPGA に興味を持たれたとしても、実際に導入するとなると “FPGAの設計・開発” にハードルを感じる方が多いのではないでしょうか。
そこで、マクニカではハードルを最小限にするため、FPGAの導入を下記の [1]~[5] のステップでサポートしています。
[1] 実現したい機能・既存システムの課題をヒアリング
[2] FPGAで実現する、具体的な構成案をマクニカから掲示
[3] FPGAの長所を活かした、メリットの追加提案
[4] FPGAの型番確定 および 概算価格の掲示
[5] FPGA 設計開発費用・期間 の掲示
お客様でご用意いただくのは、[1] で必要になるご要望をまとめたテキスト・図のみです。パワーポイント1枚程度の簡単なものでかまいません。
工数を最小限に抑えながらFPGAの設計・開発を進めることができます。また、FPGA納入後のアフターサポートも用意していますのでご安心ください。
マクニカでのサポートについて詳しく紹介している記事もありますので、合わせて参考にしてください。
FPGAの導入は本当に現実的なのか。現状のFPGAについて性能などを紹介している記事もありますので、合わせてご参考にしてください。
まとめ
今回の記事では、「音声操作の実現」にあたり “FPGA” がどう有効か、をご紹介しました。
車内は特殊な環境ということもあり、従来のICのみで音声操作を実現するとなると、さまざまな課題が考えられます。
前処理で求められる性能を、FPGAへ分散した方がメリットのあるケースが多いです。
具体的には、下記 “4つの性能” における "従来のICでの課題"、"FPGAの有効性" をご紹介しました。
求められる性能 [1] 4つ以上のマイクへの対応
求められる性能 [2] ビームフォーミングへの対応
求められる性能 [3] ノイズキャンセリングへの対応
求められる性能 [4] デバイス変更への柔軟な対応
いずれも、 “FPGA” の特長である回路データを後からでも書き換えられる柔軟性、ハードウェアデバイスによる高速な並列処理を活かすことで、求められる性能を実現可能です。
今後、車載製品における音声操作へのニーズは高まると予想しています。
ぜひ、音声操作の実現においても、 “FPGAの導入” を検討材料の一つとしてお持ちください。
お問い合わせ
本記事に関してご質問ありましたら、以下よりお問い合わせください。