高度な自然言語処理とディープラーニングで自然な日本語対話を実現

NVIDIA DGX-1 が加速する NTTレゾナントのAI事業

NTTレゾナントは、ポータルサイト「goo」やECサイト「NTT-X Store」などの運営で有名だが、教えて!gooの恋愛相談「AIオシエル」や気分にあった旅行プランを提案する「旅行AI」などのAIを活用したBtoCサービスも積極的に展開しており、高い評価を受けている。最近では、AIを活用したい企業に対してAIソリューションを提供する、BtoBサービスも展開している。NTTレゾナントが得意とするのは、自然な日本語対話を実現するチャットボットである。こうした同社のAI開発において欠かせない存在となっているのが、「NVIDIA DGX-1」だ。

チャレンジ

NTTレゾナントは、1997年3月にインターネットポータルサイト「goo」の運営を開始し、今年(2019 年)が23 年目となる。開設以来多くの人々が利用しており、Q&A サイト「教えて!goo」にも非常に多くの質問と回答が寄せられている。NTTレゾナントには、長年にわたってgooや教えて!gooを運営してきたことで、検索ログやQ&Aデータといった、膨大な日本語の表記データの蓄積がある。ディープラーニングが脚光を浴びるよりも昔から、機械学習によって膨大なデータの分析を行っており、高度な検索機能や言葉の表記ゆれへの対応、多彩な辞書機能などを実現してきた。

 

NTTレゾナントが、ここ数年特に注力しているのは、ディープラーニングを初めとするAI技術である。ディープラーニングのモデルは内部に多数の重みパラメータを保有している為、最適な重みを導き出す為には数多くの良質な教師データが必要になる。そこで、NTTレゾナントは、自社が持つ膨大なデータを使ってAI の研究開発を開始した。その成果から生まれた最初のサービスが2016 年9 月に運営を開始した「AIオシエル」である。

 

AIオシエルは、恋愛相談に対して、AI がアドバイスを提供するサービスであり、相談者が相談を書き込むと、即座に的確な回答を提供してくれる。この回答は、「共感」「結論」「理由」「励まし」の4 つの要素から構成されており、相談者の気持ちに寄り添った人間らしい回答を行うことも特徴だ。こうしたAIによる長文回答生成への取り組みは世界初であり、NTTレゾナントが持つ高いAI技術の表れといえる。

 

さらに、2017年9月には、AI が対話を通じてユーザーの気分を察し旅選びをサポートする「旅行AI」のサービスを開始した。こちらでは、ユーザーとの対話データだけでなく、goo旅行やgoo地図などの位置情報を含めた複数のデータベースをディープラーニングにより学習している。こうした取り組みについて、NTTレゾナント スマートナビゲーション事業部 サービステクノロジー部門 AIソリューション 担当部長の松野繁雄氏は、「我々は、長年にわたって日本語の自然言語処理の研究を行ってきました。日本語解析に関するAI 技術に関しては日本トップクラスだと思っています。」と胸を張る。

 

NTTレゾナントのAI技術の中でも中核となるのが、対話AIチャットボットである。チャットボットは人と会話をするAIであり、質問と回答がセットになったルールベースのものとAIが意図を理解して回答を生成するものに大別できる。松野氏は、世の中で使われているチャットボットの大半がルールベースであり、ルールにない質問に対しては、「わかりません」としか答えることができないと指摘する。一方NTTレゾナントのチャットボットは、ディープラーニング技術を用いて言葉の意図を理解し、回答を生成していることが特長である。また、チャットボットを導入したい企業に提供する場合、企業側で多くのデータを用意しなくても、NTTレゾナントが持つ辞書データや雑談データ等と組み合わせることで、少ないデータから言葉を膨らませて、多様な応答ができるチャットボットを作成できることも、他のチャットボットにはない利点である。

 

しかし、現状のチャットボットでもまだ満足はしていないと、同社のAI 技術開発のリーダーであるNTTレゾナント スマートナビゲーション事業部 サービステクノロジー部門AI担当 担当課長の中辻真氏は次のように語る。

 

「現在のチャットボットは、基本的に一問一答形式です。対話の流れを人間のように常に理解しているわけではないのです。それは世界的にもまだ確立されていません。そうした文脈の理解、それをベースとしたパーソナライズ・ユーザーの理解はまだ完全には達成できていませんが、次のステップでは、それらの達成を目指しています。」

 

ディープラーニングの学習では、活性化関数や学習率、誤差関数、最適化関数など、調整が必要なハイパーパラメータと呼ばれるものが存在する。このハイパーパラメータを適切に設定しないと学習精度が向上しないのだが、最適なハイパーパラメータを一度の試行で見つけられる訳ではなく、様々な組み合わせから最適なパラメータを見つける為に試行錯誤が必要だ。その為、同じ学習データについて、何度もパラメータを変更して学習を行わせることになる。そうすると、学習が完了するまでに、10日や20日かかることも珍しくはない。また、大量のデータを一度に学習させるためには、多量のメモリが必要になる。

 

事例続き

事例の続きはこちらからダウンロードいただけます

お客様事例 サンプル
お客様事例 1ページ目 サンプル

その他のNVIDIA製品導入事例はこちら

お問い合わせはこちら