この記事を読むと

  • AI×画像の最新動向がわかる!
  • CVPR 2020の論文を知ることができる!
  • AIの実装にチャレンジしてみたくなる!

お好きなコンテンツからどうぞ♪

◆まずは概要を知りたいという方・・・ぜひこのままコラムをお読みください!
◆最初から全部知りたいという方・・・当日の↓ 動画/講演資料 ↓をご覧ください!

※動画の閲覧には個人情報の入力が必要です

この記事を読み終えるのに必要な時間

5分

はじめに

こんにちは、AI女子部のSambaです!
本コラムでは、先日行われた一般社団法人日本自動認識システム協会(JAISA)*様主催のオンラインウェビナーについてお届けしたいと思います。
このたび、JAISA様よりお招きいただき、弊社ARIHの楠がAI×画像について講演いたしました。
*JAISA様は、自動認識技術に関する調査研究、標準化、普及啓発、 自動認識技術者資格認定試験による技術者の育成・確保、国際交流や関係団体への協力を推進されている協会です。


ところでみなさまは、AIの最新動向をどんな風に追っていらっしゃいますか?

「どうやって情報収集したらいいんだろう?」
「検索してみるけど、まとまった情報がない」
「業務が忙しくて、なかなか調査する時間が取れない」

と思うことはありませんか?

進化の早いAIというテクノロジーを追うのは、簡単なことではないですよね。
そこで活用したいのが「学会で採択された論文」です。

今回「AI ×画像”最新動向 ~デバイスから論文、事例まで一挙公開~」という題で講演させていただいたのですが、
このセッションでは、以下3つについてお話ししています。
・論文
・デバイス
・事例

それぞれのポイントをピックアップしてお伝えしていきたいと思います。それではいきましょう!

「PoC止まりが当たり前」の時代は終わった

セミナー冒頭では、AI実装の現状について触れました。
「PoC疲れ」「AI後進国」といった言葉をよく耳にしますが、実はAIの実運用、結構進んでいるんです。
ここ1年で、企業のAI導入に向けた予算は急激に増えています。
実際にARIHがサポートさせていただく案件も、実装フェーズが増えてきました。
もはやPoCで止まっていては、差が開く一方、ということです。

とはいえ、「どんなAIを実装すればいいのか」「どうやってAIを組み入れればいいのか」不安になりますよね。

AI論文はアイデアを得る宝箱

そこで活用したいのが、AI論文です。
今回は “AI×画像” ということで、 Computer VisionのトップカンファレンスであるCVPR2020の論文をピックアップしました。
CVPRの正式名称は「Computer Vision and Pattern Recognition」で、ECCV、ICCVと並ぶComputer Vision分野における世界三大国際会議の一つです。
今年はなんと、6656本もの論文が提出され、そのうち1470本が採択されています。
楠の講演ではその中から11個の論文を取り上げていますが、本コラムでは特に厳選した3つをお伝えします!

CVPR論文1.物体検知に取り組みたい方必見!:EfficientDet: Scalable and Efficient Object Detection

まずはじめに、SoTAという言葉をご存知でしょうか?
SoTAはState of the Artの略で、機械学習の分野では「もっとも高精度」であることを指します。
ここでご紹介するEfficientDetは、物体検知におけるSoTA※です。
※本論文が発表された時点でのSoTA

これまでの研究では「いかに精度をよくするか」ということに焦点が当てられていたため、現実的ではない計算リソースが必要になるケースが多かったのですが、現在は高精度だけを追い求めるのではなく、計算量とモデルサイズを小さくし、実用できるモデルにするための研究が加速しています。
EfficientDetはなんと、以前の検出器よりも4~9倍サイズが小さく、計算リソースも13~42倍小さくなっています!
物体検知に取り組みたい方はぜひ一度、EfficientDetを試してみてはいかがでしょうか?

● 豆知識 ●

EfficientDetの著者は、2019年最強の画像認識モデルともいわれたEfficientNetの著者と同じ、Google Researchの Brain Team!
たった1年でここまでの進化をとげるなんてすごいですね。


▶CVPR論文はこちら: https://arxiv.org/pdf/1911.09070.pdf

CVPR論文2.データが少ない方必見!:Adversarial Latent Autoencoders

Adversarial Latent Autoencodersは生成モデルです。
生成モデルとは、学習したデータごとに学習データに近いデータを出力できるモデルのこと。
つまり学習データには存在しないデータを生成することができます。

代表的なものとしては、GANやAutoEncorderなどがあります。
このあたりは試したことがある方も多いのではないでしょうか?
「GANに比べてAutoEncorderだと、ぼやけた画像を生成してしまうのでは・・・?」と思われるかもしれませんが、Adversarial Latent Autoendoersはこの点が改良されていて、GANのような、より良い生成モデルを達成しています。
Adversarial Latent Autoencodersの応用分野としては、異常データを集めることが難しい「大型設備の異常検知」や、画像変換による「メイクや服装の提案」などがあり、ビジネスへの展開も進んでいるようです。

● 豆知識 ●

CVPR2020ではGANに関する論文も採択されていました!気になる方はぜひチェックしてみてください♪
PSGAN: Pose and Expression Robust Spatial-Aware GAN for Customizable Makeup Transfer
CIAGAN: Conditional Identity Anonymization Generative Adversarial Networks


▶CVPR論文はこちら: https://arxiv.org/pdf/2004.04467.pdf

CVPR論文3.AIの判定根拠を知りたい方必見!: Understanding Deep Neural Networks

ここ数年、AIの説明性は非常に注目を浴びています。
AIを社会実装していく上で、欠かせない技術ですね。
例えば、下記の画像の真ん中のように、フルートの部分をぼかした(マスクした)上で、隠した領域における精度への影響度をみることで、注視しているかどうかを可視化する手法: Understanding Deep Neural Networksがあります。

出典:Interpretable Explanations of Black Boxes by Meaningful Perturbation
キャプション:Figure 1. An example of a mask learned (right) by blurring an image (middle) to suppress the softmax probability of its target class (left: original image; softmax scores above images).
https://arxiv.org/pdf/1704.03296.pdf


説明性にもさまざまな手法がありますが、アプローチとしては
1.実績のある手法を試してみる
2.その上で最新の論文を試し、どのような結果が出るかを比較する
といった進め方がおすすめです。
例えば画像データであればGrad CAM、工程データであればSHAPの実績が多くあります。
このあたりから、ぜひ試してみてください。

● 豆知識 ●

AIの社会実装フェーズでは、AIの品質保証も意識していく必要があります。
品質保証については、以下ガイドラインを参考にしてみてください♪
■ AI プロダクト品質保証ガイドライン: http://www.qa4ai.jp/QA4AI.Guideline.201905.pdf
■ 機械学習品質マネジメントガイドライン: https://www.cpsec.aist.go.jp/achievements/aiqm/AIQM-Guideline-1.0.1.pdf


▶CVPR論文はこちら:https://arxiv.org/pdf/1704.03296.pdf

進む実装環境の整備

アルゴリズムの進化に伴い、実装にかかせないハードウェアの整備も進んでいます。
以下は一例となりますが、カードサイズのGPUモジュールからGPUカード、ボックス型の端末、スーパーコンピュータまで、NVIDIAや関連サードパーティが製品をリリースしています。

画像×AIの最新事例

誰もが知りたい、事例!
講演内では6つの事例をご紹介しましたが、ここでは1つピックアップしたいと思います。
他の事例も見たい!という方は是非講演動画/資料をご覧ください!
※動画の閲覧には個人情報の入力が必要です

事例:アイシン・エィ・ダブリュ株式会社様

「カーナビゲーションシステム評価工程における目視確認を、AIで自動化」
数十人体制でテスターがナビを操作し、目視確認を実施している、カーナビの評価工程。
高度な検出スキルが必要とされるこの工程をAIで補完するため、開発を進めていました。
しかし、取り組む中で以下の課題が発生・・・
・適切な開発アプローチが分からない
・データサイエンティスト不足
・AI判定根拠の説明性が必要
さて、いかにしてこの課題を乗り越えたのでしょうか?

本事例では、Deep Learningに加え、従来手法を活用したモデルを開発し、実際に現場に実装するために重要となるAIの説明性にも着手しました。

画像×AIの最新事例詳細は、以下からご覧いただけます!

おわりに

いかがでしたか?「論文を読んで実装してみよう!」という取り組みのきっかけになれば幸いです。
CVPR以外にもさまざまなAI学会があり、今年はオンラインで開催されているものも多いので、ぜひチェックしてみてくださいね。
もし「AIについて相談してみたい」と思うことがあれば、マクニカのAI専門家組織、AI Research & Innovation Hubまでお気軽にお問い合わせください!

■ 本ページでご紹介した内容・論文の出典元/References

Mingxing Tan, Ruoming Pang Quoc V. Le, “EfficientDet: Scalable and Efficient Object Detection”
https://arxiv.org/pdf/1911.09070.pdf
Stanislav Pidhorskyi, Donald A. Adjeroh, Gianfranco Doretto, “Adversarial Latent Autoencoders”
https://arxiv.org/pdf/2004.04467.pdf
Ruth C. Fong, Andrea Vedaldi, “Interpretable Explanations of Black Boxes by Meaningful Perturbation”
https://arxiv.org/pdf/1704.03296.pdf

関連記事

*テックブログAI女子部*
最先端の研究を知ろう ― AAAI 2019 AI論文3選 ―

*テックブログAI女子部*
CVPR 2019 論文5選

*テックブログAI女子部*
[AI論文] ターゲット画像のみで画像修正を行う「Deep Image Prior」