サイト内検索

20220707-aigirl-column-cover
● こんな方におすすめ ●

・AIの学術的トレンドに興味のある方
・JSAI2022の論文を読んでみたい方
・ビジネスにおいてのAI利活用を検討されている方

この記事を読み終えるのに必要な時間

5分

イベントレポート

2022年6月14日から6月17日までの4日間にわたり、京都にて開催された2022年度 人工知能学会全国大会(JSAI)。本大会は人工知能についての研究発表を行う学会となります。

一昨年から新型コロナウィルス感染症の影響でオンライン開催となっておりましたが、今年はオンラインとオフラインのハイブリッド開催の試みとなりました。今年は論文総数727本。オーガナイズドセッションや企業展示などもオフラインで開催され、久しぶりの賑わいが感じられました。

弊社でも過去のJSAIレポートを掲載しておりましたように、これまでは、 採択論文のなかでAIの説明可能性(XAI)に関連したキーワードが多く見られましたが、 今年は自然言語などの時系列データを扱うモデル(Transformer, BERT)、強化学習や対話システム、また 医療に関連するキーワード(心電図やヘルスケアなど)、脳科学に関連するキーワード(脳波/EEGやホメオスタシスなど)が 増えました。その他にも 、「データ拡張」 に関連するキーワードが以前より見られ増えました。 (図1参照)今回は、 JSAI2022採択論文の内容を基に弊社で作成したキーワード分布 から見られるトレンドキーワードを持つ論文をピックアップし、ご紹介いたします。

図1:JSAI採択論文の内容を基にマクニカ作成

論文トレンド

強化学習

まずIBM Researchチームから提唱された『ニューロシンボリックAIによる強化学習 』をご紹介します。本論文では、Logical Neural Networks(LNN)を活用したLogical Optimal Action(LOA)という強化学習手法を提唱し、テキストベースのゲームにおいては従来のニューラルネットワークより学習論理に説明可能性があり、さらには効率良く学習することができると結論付けています。

LNNとは、ニューロシンボリックAIの手法であり、近年『Logical Neural Networks 』にてIBM Researchチームから深層学習の一つとして説明可能性を担保できるとして提唱されました。

LNNの革新的な技術は推論結果を導くためのモデルのネットワークに使用する計算式を学習する点です。一般的 なニューラルネットワークは入力データの特徴に「その特徴がどれくらい結果を出すために重要か」を示す重みを付けて、指定の計算式で予測結果が最良になるようにこの重みを学習します。計算式で使用される論理式(AND、OR、NOTなど)は通常既定されていますが、LNNではモデル内で最良の論理式を学習することができます。本論文では、テキストベースのコイン獲得を目的としたゲームにおいて、LNNを活用してモデルの強化学習を行うLOAと、行動選択における深層学習モデルのLSTM-DQN++、従来のニューロシンボリック強化学習法のNLM-DQNを比較し、 モデルの精度や学習効率においてLOAが優位であると結論づけました。また、LOAでは論理記号を使ったルールを学習しており、学習内容の確認が可能な点において説明可能な強化学習が実現できると提案しています。

AIのアルゴリズムがブラックボックスであることから以前よりその説明可能性について問われていました。本論文が提案する学習内容の確認が可能なモデルにおいては、AIが導き出す答えや推論への信頼性が向上すると期待できます。

出典:第34回人工知能学会全国大会 講演番号[3Yin2-56]
"ニューロシンボリックAIによる強化学習"
キャプション:図1:提案手法の概要図
https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_3Yin256/_pdf/-char/ja

対話システム

次にTransformerモデルを活用した対話システムについての論文をご紹介します。

音声認識、言語処理などの技術が進歩したことにより、近年コミュニケーション支援デバイスが普及していることは顕著です。そこで、NTTコミュニケーション科学基礎研究所と東京電機大学が研究した『共生社会におけるアンドロイドロボットのためのマルチモーダル対話戦略の構築』では人間のコミュニケーション相手としてのアンドロイドロボット(AR)の技術課題を整理するため、ARを使った実験を行いました。本論文では、同著者であるNTTコミュニケーション科学基礎研究所から発表された『Empirical Analysis of Training Strategies of Transformer-based Japanese Chit-chat Systems』にて提案されたTransformer ベースの大規模対話モデルとBERTを活用し、マルチモーダル対話戦略を用いてARに対話システムを実装しました。(図3を参照)対話シナリオの概略図は図4に示します。


出典:第34回人工知能学会全国大会 講演番号[2N5-OS-7a-02]
"共生社会におけるアンドロイドロボットのためのマルチモーダル対話戦略の構築"
キャプション:図1:アンドロイド I と客による対話の様子
図2:対話シナリオの概略図
https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_2N5OS7a02/_pdf/-char/ja

まず本論文では、通常のロボット対話では扱われることの少ない二つの課題を指摘しました。その一つが、マルチモーダルアクチュエータとしてのAR であり、もう一つが、非対称コミュニケーションの相手としてのAR です。前者は、人間が無意識のうちに行っている顔表情や音声などの動きをARに実装していく必要があるという点であり、後者は、人間を疑似するARに対する人間が認識するであろう「違い」を前提としてARの最適な行動制御をする必要があるという点です。

AR対話システムの実装による検証の結果、AR対話システムにおいて、対話姿勢、うなずき、顔の表情が親近感の醸成に友好的であり、あい対する人間の満足度を損なうことのないコミュニケーションが可能だと示しました。一方で,人間相手では観察されないような,不自然な動作パターンがAR が相手の時には観察されており,それを想定としたAR の最適行動制御が今後の検討課題であると結論付けました。

近年、少子高齢化に伴う労働力不足を解消するための手段としてARの社会実装が期待されております。本論文の実験から、ARの社会実装に向けて自然な動作を身につけるために更なる検証実験を進める必要があると結論付けましたが、AR対話システムの社会実装に期待できるとがわかりました。

合成データ

最後に国立がん研究センター研究所、理化学研究所革新知能統合研究センターの論文『編集可能な医用画像生成」をご紹介します。

本論文は、合成データを生成可能な敵対的生成ネットワーク(GAN)の特性に着目し、医療向けの合成データ生成のアプローチを提唱しました。GANモデルはデータセット中の最も頻度の高い特徴量に過剰にフィットするという固有の傾向があり、医療分野での症例画像にバリエーションが少ないことから合成データに偏りが予測されることが懸念されていました。

そこで、本論文では、臨床医学においては病気を判断する際に専門知が存在していることに着目し、GANのアーキテクチャ内にユーザーによる編集操作を受け付けることが可能なセグメンテーション画像を中間的な結果として生成することを提案しました。セグメンテーション・マップの生成には自己教師あり学習が用いられ、編集可能であるため、データの生成過程で医師が直接編集を可能となり、専門知と相補することが可能な生成アルゴリズムとなりました。

本論文により、医療分野における特定の疾患の特徴を十分に網羅したデータセットを構築可能となり、医用画像における学習データの少数性という課題を解決できると考えられます。

出典:第34回人工知能学会全国大会 講演番号[2K5-OS-1a-01]
"編集可能な医用画像生成"
キャプション:Fig.1 ニューラルネットワーク・アーキテクチャの概要。
https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_2K5OS1a01/_pdf/-char/ja

まとめ

今回はJSAI2022にてトレンドとして見られたトピックに関して、論文を3つ紹介しました。

『ニューロシンボリックAIによる強化学習』では、過去のJSAIと同様AIの説明可能性に着目し、新たな説明可能な強化学習手法を提唱しており、対話システムでは以前のロボット対話では考慮されていない課題について実験することで、今後より自然なARの対話システムに最適行動制御が必要だと明らかにしました。この2つの論文から、人間のAIに対する認知や理解に寄り添った方法でのAIの社会実装が潮流として見受けられました。また、合成データ生成技術の取り組みからわかるように、社会実装を行うために求められるAIの精度をより向上させるために、データ不足といった実世界の課題を解決する研究が盛んに行われるでしょう。

■ 本ページでご紹介した内容・論文の出典元/References



木村 大毅, SUBHAJIT Chaudhury, SARATHKRISHNA Swaminathan, 田中 恒彦, DON Joven Agravante, 立堀 道昭, ASIM Munawar, ALEXANDER Gray
"ニューロシンボリックAIによる強化学習"
図1:提案手法の概要図
https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_3Yin256/_pdf/-char/ja

河本 真琴, 河窪 大介, 杉山 弘晃, 酒造 正樹, 前田 英作
"共生社会におけるアンドロイドロボットのためのマルチモーダル対話戦略の構築"
図1:アンドロイド I と客による対話の様子
図2:対話シナリオの概略図
https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_2N5OS7a02/_pdf/-char/ja

小林 和馬, 高見澤 康之, 伊藤 その, 三宅 基隆, 金光 幸秀, 浜本 隆二
"編集可能な医用画像生成"
Fig.1 ニューラルネットワーク・アーキテクチャの概要。
https://www.jstage.jst.go.jp/article/pjsai/JSAI2022/0/JSAI2022_2K5OS1a01/_pdf/-char/ja

関連記事

*テックブログAI女子部*
【スポーツ×AI】スポーツシーンにおけるAI活用事例5選

*テックブログAI女子部*
【スマートビルディング×AI】スマートビルディングにおける社会課題へのAI活用事例3選

*テックブログAI女子部*
バックエンド業務×AIでビジネスプロセスを改善する方法3選