Jetsonビデオ処理プログラミング　第10話計算リソースの最大活用 - 半導体事業

条件を指定して絞り込む

現在2004件がヒットしています。check

設計 AI・人工知能ソフトウェアマイコン・プロセッサー・DSP モジュール NVIDIA

本連載を通してビデオ処理システムの各処理ステップで利用できるソフトウェアライブラリー（API）について解説させていただきました。高い処理性能を得るには、各処理ステップでどのAPIを選択するかは重要ですが、それらをどう組み合わせるかも非常に重要です。本連載最終回は、各APIを上手に組み合わせて、Jetson内部の計算リソースを最大活用するための指針について述べさせていただきます。

[Jetsonビデオ処理プログラミング]

第1話　NVIDIA提供 JetPackとSDKでできること

第2話　ビデオ入力（CSI接続のLibargus準拠カメラ）

第3話　ビデオ入力（USB接続のV4L2準拠カメラ）

第10話　計算リソースの最大活用

Jetson内部の計算リソース

まず、Jetson内部の計算リソースについておさらいをしましょう。

計算リソース	用途	アクセス可能なAPI	備考
GPU (CUDA Cores)	画像処理グラフィックス汎用計算	CUDA cuDNNやNPPなどのCUDAライブラリー TensorRT VPI GStreamer	多数のコアから構成
Deep Learning Accelerator (NVDLA)	ディープラーニング	TensorRT	Xavierシリーズのみ
Tensor Cores	ディープラーニング	cuDNN TensorRT	Xavierシリーズのみ
Programmable Vision Accelerator (PVA)	コンピュータービジョン	VPI	Xavierシリーズのみ
NVIDIA Video Encoder Engine (NVENC)	動画エンコード	GStreamer Jetson Multimedia API
NVIDIA Video Decoder Engine (NVDEC)	動画デコード	GStreamer Jetson Multimedia API
NVIDIA JPEG Engine (NVJPG)	JPEGエンコード／デコード	GStreamer Jetson Multimedia API
Video Image Compositor (VIC)	画像フォーマット変換画像リサイズ	VPI
Image Signal Processor (ISP)	RAWデータ処理	Jetson Multimedia API（詳細は非公開）
CPU Complex	あらゆる計算	あらゆるAPIを利用できるが、ビデオ系では以下のとおり。 VPI OpenCV GStreamer	64-bit ARM マルチコア
Audio Precessing Engine (APE)	オーディオ処理	ALSA	ARM Cortex-A9

リソースを最大限に活用するための方針

上記の表で、Jetson内部には多数の計算リソースが存在することを再確認いただいたと思います。これらを最大限活用するための方針は当然ながら、すべてのリソースを休ませることなく同時に動作させることです。

注：厳密に考えると、リソースの同時動作に制約が存在する場合（データバスの競合など）もありますが、まずは単純に考えて、全リソースの同時動作を目指すこととします。

リソースが2個の場合で考えてみましょう。以下、左側の場合は、CPU上のアプリケーションスレッドがGPUに逐一、処理の開始を命じる必要があり、その間、まとまった処理が実行できません。非NULLのCUDAストリームを使うと、一つ一つのGPU処理で同期を取る必要がなくなり、GPU上で処理が進んでいる間にも、アプリケーションスレッドで別のデータに対する処理が可能となります。

CUDAストリームに類似の仕組みがVPIにも用意されています。