
こんな方におすすめの記事です
・国際的なAIのトレンドに興味のある方
・AIの最先端技術に興味のある方
・ビジネスにおいてのAI利活用を検討されている方
この記事を読み終えるのに必要な時間
5分
「AAAI 2023」とは
2023年2月7日から14日までの2週間、米国はワシントンD.C.にてAAAI 2023が開催されました。新型コロナウイルス感染症の影響を受け、今年は現地とオンラインでの開催となりました。
AAAI(Association for the Advancement of Artificial Intelligence)は、思考や知的行動の基盤となるメカニズムの科学的理解を深めることを目的に設立された、人工知能分野における最高峰の科学学会です。
今回行われたAAAI 2023(AAAI Conference of Artificial Intelligence:AAAI 人工知能学会)は、理論的および応用的なAI研究および研究者や技術者間などの知的交流などの促進を目的としたカンファレンスで、今年で第37回をむかえました。
AAAI2023では、SONYやIBM、Amazon scienceなどの大手企業もスポンサーとして協賛。また、研究発表や講演ではハーバード大学などの世界屈指の研究機関からも発表がありました。
今回は、AAAI2023でみられた人工知能分野のトレンドや特別講演をご紹介します。
AAAI2023のトレンド
コンピュータビジョンと言語
AAAI2023では、画像認識の分野におけるコンピュータビジョンと自然言語処理のマルチモーダル(フォーマットが異なる複数の情報の組み合わせ)の手法や実装に、注目が集まっていました。
コンピュータビジョンと言語の組み合わせの活用例としては、視覚的な質問に対する自然言語処理を活用した回答や、画像に対するキャプション生成、画像認識タスクにおける言語を活用した事前学習などが挙げられます。
なかでも「視覚的な質問に対する自然言語処理を活用した回答」は、「VQA(Visual Question Answering)」と称され、近年特に注目されています。VQAでは入力画像に対する畳み込みネットワークなどの画像認識処理と、自然言語処理を活用した文章生成を出力として行います。
これらのマルチモーダル技術が既に活用されているものが、最近話題になっている、OpenAI社のChat GPTです。2023年3月14日(現地時間)に発表された大規模言語モデル「GPT-4」では、画像を入力データとし、それに対する言語出力を行うことが可能になりました。なおChat GPTの有料プラン「ChatGPT Plus」では「GPT-4」を既に利用可能であるため、これから一般ユーザーの体験も進んでいくでしょう。
強化学習
こちらも、以前から注目されている分野です。AAAI2023では、近年話題のマルチエージェント強化学習(MARL: Multi-Agent Reinforcement Learning)に関する発表が多くみられました。
従来の強化学習は、1つのエージェントが報酬を最大化しながら最適な方策を見つけることが基本でした。一方、MARLは複数のエージェントが協調、対戦、またはその複合の関係を経て最適な方策を見つけるとされています。そしてAAAI2023では、協調型のMARLが特に注目されていました。
また、データの取り扱いに関わるオフライン強化学習にも注目が集まっていました。
オフライン強化学習とは、過去に収集されたデータを扱い、方策に対して報酬を与えながら学習を進める手法のことです。ちなみに、データを継続して取得し、リアルタイムな学習を行うものをオンライン強化学習といいます。
一見すると、即時性があるオンライン学習が優れているように思えます。しかしオフライン学習は過去に取得された、つまり既に確立されたデータでシンプルな学習を行うため、安定性やモデル実装のしやすさが利点とされています。
MARLとオフライン強化学習という2つの要素から、強化学習の更なる技術発展や、社会実装への工夫が引き続き取り組まれることに期待がもてます。
AIのセキュリティと安全性
AIのセキュリティ分野では技術的な側面だけでなく、AIを取り巻く様々な課題についても議論がなされています。例えば、AIの説明可能性、個人情報の取り扱い、AIに関する法制定などの問題がそれに当たります。
米国でも名高いパデュー大学の研究組織から発表された『SimFair: A Unified Framework for Fairness-Aware Multi-Label Classification』では、機械学習アルゴリズムが導き出す意思決定の公平性について記され、AAAI2023の論文賞にあたる優良論文賞(AAAI-23 Distinguished Paper)に選ばれました。
他にも学習データにおけるラベルの多様性やバイアスについてなど、様々な視点でAIのセキュリティや安全性について発表が行われました。
特別講演
マサチューセッツ工科大学のジョシュ・テネンバウム(Josh Tenenbaum)教授が行った『Learning to See the Human Way』の講演では、機械や人工知能に人間らしさを組み込むことについてプレゼンテーションが行われました。
近年、人工知能分野の研究者や学者の間では、ヒトが思考しているかのように深層学習モデルや機械学習モデルを開発することが目標となっています。
今までに確立している人工知能技術のなかで、例えば物体認識モデルなどはヒトがラベル付けした画像データを学習しているため、ラベル付けが完全ではない場合、機械による精度の高い物体検出が難しい現状があります。
また、機械は物体の関連性やコンセプトを理解しておらず、データのパターンを学習し推論しているため、誤検出や誤分類が起こります。一方、ヒトは経験や知識という膨大なデータから対象物やその状況を判断し、物体を認識できます。
これは認知や論理、言語や計画的思考などを繋ぎ合わせるヒトの直観的な感覚が成せる業であり、これを機械が取得することは未だに成し遂げられていません。なおヒトの脳は生後2~3か月から発達し始め、言語理解よりも前に先述の認知や論理的思考などが少しずつはたらくようになります。
これらのことから、テネンバウム教授は、「発達心理学や神経科学の知見からヒトの学習のベースを理解することや、(我々が想像している以上に洗練されている)ヒトの学習アルゴリズムを取り組むための確率的プログラミングやプログラム合成、ゲームエンジンツール、シミュレーターを駆使することが、機械や人工知能をヒトが思考するように開発する打開策になっていくはずだ」と説明しました。
まとめ
今回は世界的に有名な人工知能の学会である、AAAI を紹介しました。
本学会では毎年、深層学習や機械学習の新たな手法や実装に関わる発表が注目されています。2023年は、「コンピュータビジョンと言語」「強化学習」「AIのセキュリティと安全性」が特に目立ったトピックとなりました。
マルチモーダルな手法により人工知能の可能性が飛躍的に広がっていることから「コンピュータビジョンと言語」の展開は間近とも思われます。また「強化学習」でも、実装の観点から学習手法やデータの扱いについて、工夫がなされていることがわかりました。
人工知能の活用が進んだ先に考慮すべき「AIのセキュリティと安全性」は引き続きディスカッションされていくトピックの1つですが、今回はアルゴリズムの意思決定の公平性についての論文が優秀論文に選ばれるなど、学会組織からの注目度の高さもうかがえました。
来年のAAAIではどのようなトピックがディスカッションされるか、「人工知能の今」を知るうえでも、注目していきたいところです。