高度な自然言語処理とディープラーニングで自然な日本語対話を実現 - NVIDIA

本事例のポイント

合計128GBのメモリでパラレルな検証が可能
NGCコンテナを利用して短時間で環境を構築
毎年性能を向上させるNVIDIAの新製品に期待

今回取材させていただいたお客様

エヌ・ティ・ティレゾナント株式会社様

NTT レゾナントは、ポータルサイト「goo」や「教えて !goo」に蓄積された膨大なデータを活用したディープラーニングによる、自然な日本語対話を実現するチャットボットを開発。恋愛相談を行う「AI オシエル」や旅行プランを作成してくれる「旅行AI」など、AI を活用した BtoC サービスを次々に展開し、高い評価を受けている。

AI 開発では、ディープラーニングの学習に時間がかかることがネックであったが、2016 年 4 月に NVIDIA から登場した世界初のディープラーニング向けスーパーコンピューター「DGX-1」を導入することで、AI 開発の速度が大きく向上。AI を活用したより高度なサービスを展開できるようになった。

企業HP：https://www.nttr.co.jp/

　NTT レゾナントは、AI 活用ノウハウや技術を法人向けソリューションとして提供する「goo AI x DESIGN」を、2018 年にリリースした。goo AI x DESIGN では、キャラクター AI によるチャネル創出やプロモーション、ユーザーとのエンゲージメントの実現、ドラマキャラクターを AI で実現し、ファンと密な関係を構築することが可能だ。日テレとの協業による「AI カホコ」や「AI 菜奈ちゃん」などのドラマキャラクターと会話できるサービスが公開され、大きな話題を集めた。

NVIDIA DGX-1 が加速する NTTレゾナントのAI事業

NTTレゾナントは、最近では、AIを活用したい企業に対してAIソリューションを提供する、BtoBサービスも展開している。NTTレゾナントが得意とするのは、自然な日本語対話を実現するチャットボットである。こうした同社のAI開発において欠かせない存在となっているのが、「NVIDIA DGX-1」だ。

チャレンジ

NTTレゾナントは、1997年3月にインターネットポータルサイト「goo」の運営を開始し、今年（2019 年）が23 年目となる。開設以来多くの人々が利用しており、Q&A サイト「教えて!goo」にも非常に多くの質問と回答が寄せられている。NTTレゾナントには、長年にわたってgooや教えて!gooを運営してきたことで、検索ログやQ&Aデータといった、膨大な日本語の表記データの蓄積がある。ディープラーニングが脚光を浴びるよりも昔から、機械学習によって膨大なデータの分析を行っており、高度な検索機能や言葉の表記ゆれへの対応、多彩な辞書機能などを実現してきた。

NTTレゾナントが、ここ数年特に注力しているのは、ディープラーニングを初めとするAI技術である。ディープラーニングのモデルは内部に多数の重みパラメータを保有している為、最適な重みを導き出す為には数多くの良質な教師データが必要になる。そこで、NTTレゾナントは、自社が持つ膨大なデータを使ってAI の研究開発を開始した。その成果から生まれた最初のサービスが2016 年9 月に運営を開始した「AIオシエル」である。

AIオシエルは、恋愛相談に対して、AI がアドバイスを提供するサービスであり、相談者が相談を書き込むと、即座に的確な回答を提供してくれる。この回答は、「共感」「結論」「理由」「励まし」の4 つの要素から構成されており、相談者の気持ちに寄り添った人間らしい回答を行うことも特徴だ。こうしたAIによる長文回答生成への取り組みは世界初であり、NTTレゾナントが持つ高いAI技術の表れといえる。

さらに、2017年9月には、AI が対話を通じてユーザーの気分を察し旅選びをサポートする「旅行AI」のサービスを開始した。こちらでは、ユーザーとの対話データだけでなく、goo旅行やgoo地図などの位置情報を含めた複数のデータベースをディープラーニングにより学習している。

エヌ・ティ・ティレゾナント株式会社スマートナビゲーション事業部
サービステクノロジー部門 AI ソリューション担当部長
松野繁雄氏

こうした取り組みについて、NTTレゾナントスマートナビゲーション事業部サービステクノロジー部門 AIソリューション担当部長の松野繁雄氏は、「我々は、長年にわたって日本語の自然言語処理の研究を行ってきました。日本語解析に関するAI 技術に関しては日本トップクラスだと思っています。」と胸を張る。

NTTレゾナントのAI技術の中でも中核となるのが、対話AIチャットボットである。チャットボットは人と会話をするAIであり、質問と回答がセットになったルールベースのものとAIが意図を理解して回答を生成するものに大別できる。松野氏は、世の中で使われているチャットボットの大半がルールベースであり、ルールにない質問に対しては、「わかりません」としか答えることができないと指摘する。一方NTTレゾナントのチャットボットは、ディープラーニング技術を用いて言葉の意図を理解し、回答を生成していることが特長である。また、チャットボットを導入したい企業に提供する場合、企業側で多くのデータを用意しなくても、NTTレゾナントが持つ辞書データや雑談データ等と組み合わせることで、少ないデータから言葉を膨らませて、多様な応答ができるチャットボットを作成できることも、他のチャットボットにはない利点である。

しかし、現状のチャットボットでもまだ満足はしていないと、同社のAI 技術開発のリーダーであるNTTレゾナントスマートナビゲーション事業部サービステクノロジー部門AI担当担当課長の中辻真氏は次のように語る。

「現在のチャットボットは、基本的に一問一答形式です。対話の流れを人間のように常に理解しているわけではないのです。それは世界的にもまだ確立されていません。そうした文脈の理解、それをベースとしたパーソナライズ・ユーザーの理解はまだ完全には達成できていませんが、次のステップでは、それらの達成を目指しています。」

ディープラーニングの学習では、活性化関数や学習率、誤差関数、最適化関数など、調整が必要なハイパーパラメータと呼ばれるものが存在する。このハイパーパラメータを適切に設定しないと学習精度が向上しないのだが、最適なハイパーパラメータを一度の試行で見つけられる訳ではなく、様々な組み合わせから最適なパラメータを見つける為に試行錯誤が必要だ。その為、同じ学習データについて、何度もパラメータを変更して学習を行わせることになる。そうすると、学習が完了するまでに、10日や20日かかることも珍しくはない。また、大量のデータを一度に学習させるためには、多量のメモリが必要になる。

ソリューション

NTTレゾナントの強みである、自然な日本語を生成する高度なチャットボットをさらに進化させるには、より高速で大容量のメモリを搭載したシステムが不可欠である。

そこで中辻氏らが注目したのが、NVIDIAが2016年4月に発表した世界初の「ディープラーニング向け」スーパーコンピューター「DGX-1」である。

DGX-1は、NVIDIAの機械学習向けGPU「Tesla P100」を8基と、Xeonを2基搭載したディープラーニング向けGPUアプライアンスサーバーである。8つのGPUはNVLINKで繋がっており、GPU間の高速なメモリ転送が実現できる。ディープラーニングのトレーニングには、複数GPUを用いる事も多い為、3Uラックサイズながら、半精度で170TFLOPSもの演算性能を誇るDGX-1は、より短時間でディープラーニングの学習を行いたいという、中辻氏らの要望に応えてくれる唯一無二のマシンといえる。DGX-1発売の報を知ったNTTレゾナントAIチームは、DGX-1の導入を決定した。

リザルト

中辻氏らが大きな期待を寄せて導入したDGX-1だが、その効果は絶大であった。DGX-1に搭載されているTesla P100には1基あたり16GBの高速メモリが搭載されており（注:現行のDGX-1では、Tesla P100の後継であるTesla V100が搭載されており、1基あたりのメモリも32GBに倍増している）、合計128GBものメモリを利用できる。

スマートナビゲーション事業部サービステクノロジー部門
AI 担当担当課長博士（情報学）
中辻真氏

「DGX-1のおかげで、パラレルに検証ができるようになりました。パラメータセットを変えたものを同時に学習させたり、複数のレコメンドシステムを走らせて、どれが一番いい結果を出すかといった検証も容易になりました。具体的に何倍速くなったというデータは持っていませんが、体感ではかなり速くなっています。」（中辻氏）

DGX-1の導入によって、NTTレゾナントのAI開発はより加速され、AIを導入したい企業に向けて、同社のAI技術をソリューションとして提供するgoo AI x DESIGNをスタートすることになったのだ。goo AI x DESIGNは、企業のニーズに合わせ、チャットボットなどのAI技術の導入を支援するセミオーダーソリューションであり、NTTグループのリソースを活用したサービスとなっている。

DGX-1の利点として強調したいのは、NVIDIAはNGCサイト内でAI開発に便利なスクリプトや学習済モデル、GPUに最適化されたディープラーニングのフレームワークのコンテナなど様々な物を無償で提供していることだ。これによりユーザーはDGXの優れた計算性能をNGCから使用したいフレームワークのコンテナやスクリプトをダウンロードする事で簡単に享受する事が可能になる。実際に、中辻氏らはNGCコンテナを利用して、短時間で環境を構築できたという。DGX-1の導入によって、NTTレゾナントのAI開発の速度は加速されたが、さらに先に進むためには、さらに高い演算性能が必要になると中辻氏は言う。

「DGX-1でも、我々が扱っている大量のデータの学習・検証には数日かかることがあります。NVIDIAは、毎年性能を向上させた新製品を開発しているので、期待しています。また、フレームワークによっては、自然言語処理における世界最先端のライブラリの品ぞろえが弱いと感じるのですが、NVIDIAには、AIに関する情報のハブとなっていただいて、そうしたところをサポートしていただけるとありがたいです。」

NTTレゾナントが現在開発に取り組んでいるのが、ユーザーごとにパーソナライズされたAIだ。

「過去の会話の文脈からユーザーの嗜好をおさえることで、的確なリコメンドができるようになります。積極的にユーザーと対話をしながらレコメンドを行う技術を、今開発中です。さらにその先にあるのは、人間とAIがフレンドリーに話し合えるようになることです。そのためには、AIが創造力を持つことが重要です。場の空気を読むAIというか、AIが本当に考えて創造的な応答を行うシステムを作ることが目標です。今後も、NVIDIAのGPUの性能向上に期待しています。」（中辻氏）