はじめに
近年盛り上がりを見せているAIの活用ですが、最近では “エンドポイントAI” という言葉が使われ始めています。
この記事では、クラウドAIやエッジAIと比較したエンドポイントAIの特徴を説明します。
加えて、エンドポイントAIの事例と使用するAIチップに関して紹介していきます。
■ 目次
1. そもそもクラウドAIとエッジAIとは?
2. エッジAIのその先!?エンドポイントAIの特徴
3. エンドポイントAIの事例
1. そもそもクラウドAIとエッジAIとは?
従来多くのシステムでは、データをクラウドへ送信し、クラウド上でAI解析をおこないます。
クラウドAIは大規模で正確な解析には優れますが、ネットワーク接続が必須、解析に時間がかかる、プライバシーのケアが必要、といった様々な課題もあるので、ある程度の処理をエッジ側で完結させることが求められつつあります。

例えば、カメラで映した画像に何が映っているかを解析するシステムにおいて、クラウドAIを活用した場合とエッジAIを活用した場合を比較してみます。
クラウドAIの場合
まず、クラウドAIの場合、全ての画像データをクラウドへアップロードすることになります。
組み込み機器のスペックの演算能力不足・NNモデルのレイヤ制限などの影響を受けないので、高精度な解析が可能です。
また、NNモデルアップデートが必要になった場合、再学習のしやすさ(環境の整えやすさ)も魅力の一つです。
一方で、画像を送信することによる通信費増大、人が映っている場合のプライバシーケア、また全データをクラウド解析する事による、負荷の一極集中が懸念されます。

エッジAIの場合
次に、エッジAIの場合は、先ほど述べた課題を解決可能です。
具体的には下記のように、Closed Networkを組んでローカルでAI推論がおこなえる環境を構築します。
こうすれば、クラウドへ共有するものは結果だけで済み、画像データまでは共有する必要がなくなります。
人の “画像データ” をクラウドへ共有する場合に比べて、人の有無という “結果だけ” を共有する方が、プライバシー、通信費、クラウド負荷の各種観点においては有利になります。

このように、クラウドAIの課題クリアが見込めるエッジAIですが、実際のところ、活用事例はまだ限定的のようです。
その理由として、ローカルでの環境構築が課題として挙げられます。
推論をさせる為には高価な中継器(エッジサーバー、エッジゲートウェイなど)を設置する必要があり、かつその中継器の仕様に合わせてシステム構成全体を見直す必要がでてきます。
したがって、エッジでAI処理をさせるメリットと既存システム変更にかかるコストをしっかり吟味する必要があります。
2. エッジAIのその先?エンドポイントAIの特徴
クラウドに画像データを上げずにClosed Network内で処理を完結させる事がエッジAIでした。
Closed Network内でも、特に端末側だけで処理を完結することをエンドポイントAIといいます。

エンドポイントAIの領域
それでは、先ほどと同様に、カメラで映した画像に何が映っているかを解析するシステムを考えてみます。
結果だけをクラウドへ共有する、という点ではエッジAIと同じですが、中継器ではなく端末内で推論を完了させることができるのが最大の特徴です。
つまり、エッジAIの場合は、端末から中継器までは画像データでやり取りが必要でしたが、エンドポイントAIの場合は、端末から既に推論結果のみが出力されます。
推論結果のみなのでデータ量は圧倒的に小さくなり、I2CやUARTといった汎用I/Fで中継器と接続可能です。
もし、元々中継器を介さないシステムであれば、中継器自体を新規に設置しなくて済みます。
既存システムへの変更を最小限に抑えながらAI導入が見込めることが、エンドポイントAIの最大の特徴となります。

しかし、エンドポイントAIを実現するためには、AI処理が可能なチップを製品端末に実装する必要があります。
端末では筐体サイズの制約を受け、バッテリー駆動の製品では電力を抑える必要があります。
また、コストも大きなファクターになるでしょう。
さらに、エンドポイント向けに小型低消費電力デバイスを選定する場合、AI処理精度はある程度限定的になってしまいます。

これらの要素を加味しながら、現在のシステムにおいて、どこにAI処理を持たせる事が適切か?を検討する必要があります。
以上を踏まえて、エンドポイントAI, エッジAI, クラウドAIの特徴は下記のように比較することができます。
エンドポイントAI |
エッジAI |
クラウドAI |
|
推論処理に必要なシステム |
端末のみ | 端末+中継器 | 端末+中継器+サーバー |
ネットワーク依存 |
依存なし | 依存なし | 依存あり |
リアルタイム処理 |
レイテンシー極低 | レイテンシー低 | レイテンシー高 |
通信費 |
安い | 安い | 高い |
プライバシー性 |
担保しやすい | 担保しやすい | 担保しにくい |
AI処理精度 |
限定される | 優れる | 非常に優れる |
実装デバイス特徴 |
小型/低消費電力なAIチップ | ハイスペックGPU等 | デバイス実装は不要 |
3. エンドポイントAIの事例
高精度/高パフォーマンスが求められる処理は、エッジ(中継器)やクラウドで正確に処理をする必要があります。
しかし、システム構築にかけられるリソースは限られますので、必ずしもそうでない処理はエンドポイントに任せる方がメリットがありそうです。
では、エンドポイントAIで可能な処理と、そのAIチップはどのようなものなのでしょうか?
例えば、カメラ端末にエンドポイントAIを実装した場合、
「グー、チョキ、パー、OKなどのハンドジェスチャーを検知する」
「複数人(5~10人程度)の特徴量を記録し個人認証をする」
「人間や物体を認識し、その範囲座標を取得する」
などの処理が可能です。

上記の例では、Lattice Semiconductor社のFPGAを用いています。
LatticeのFPGAは小型・低消費電力に強みを持った製品が多いので、エンドポイントAIに向いている特徴を持っています。
具体的には、2.15×2.55mmのチップにトレーニング済モデルを実装して、7mWの電力でジェスチャー検知をおこなっています。

LatticeのFPGA iCE40UltraPlusは塩の粒と比較できるほど小型なのでエンドポイントAIに向いている
この程度のサイズ/電力であれば、製品端末側への実装も視野に入ってくるのではないでしょうか。
これらのAI処理を含め、他にも様々なエンドポイントAIのデモ動画を下記リンクに掲載しています。
全てLatticeのFPGAを使った場合のものですが、まずはエンドポイントAIでどの程度の処理ができるのかを確認してみてください。
エンドポイントAIの導入検討をしたいが開発リソースが割けない、、、
システムへの導入検討を始める際、もちろん動画だけではなく実際にパフォーマンスを判断する必要がありますが、初期から大量のリソースを割いて評価開始できるケースは稀だと思います。
特にAIの導入検討は新規要素が多く、なかなか自社への導入が進まないとお悩みの方も多いのではないでしょうか。
マクニカでは設計支援ツールを開発しており、評価ボードを準備すれば、すぐに評価を開始することが可能です。
具体的には、自社環境で取得した画像を元に、Latticeが用意しているデモデザインを用いてAI処理をさせてみることが可能です。
まずは簡単にパフォーマンスを確認した後、本格的に開発をスタートするかどうか、判断することが可能です。
