H2O.ai

エイチツーオードットエーアイ

Driverless AI 機能紹介(デモ)

Driverless AI 機能一覧

データの自動可視化

アップロードしたデータセットについて、データの関係性等が自動で視覚化されます。そのため直感的にデータを理解することができ、モデル作成前にデータの概要を掴むことができます。 外れ値、ヒストグラム、相関グラフ、ヒートマップ等

  • データの自動可視化
  • データの自動可視化

特徴量自動設計

モデルの精度向上のために重要となるデータセット自体の改善作業(特徴量設計)を自動化しています。元々与えられたデータセットから様々なテクニックを駆使し新たな特徴量を設計するこの作業は、データサイエンティストのスキル・経験・アイディアに依存する部分が大きいですが、Driverless AIではこの部分を全て自動化しており、ユーザは高度なスキルを必要としません。

  • モデルの判定理由可視化

モデルの判定理由可視化

作成されたモデルをビジネスシーンで適用する際、モデルの予測結果の説明が求められることはないでしょうか。AIのブラックボックス化を防ぐために、Driverless AIでは予測結果に影響を与えたパラメータを視覚的に解釈することができます。

◎ K-LIME、Shapley、 Variable Importance(変数重要性)、Decision Tree(決定木)、Partial Dependence(部分依存)モデル全体はもちろん、クラスタごと、個別の結果ごとの説明をすることができます。

  • モデルの判定理由可視化
  • モデルの判定理由可視化

モデル結果レポート作成

作成されたモデルをビジネスサイドや経営層に説明する際に必要となるレポートを自動生成してくれます。モデルを作成する際に使用したデータの詳細、アルゴリズム、モデルチューニングフローについて説明がされます。時間をかけて検証レポートを作成する手間がなくなるため、モデルの本番環境への移行を短期間で行うことができます。

特に特徴量設計について、特徴量の重要度、使用された特徴量設計のテクニック等が説明されます。

  • モデル結果レポート作成

Python, Java環境用実行モジュール生成

Driverless AIでは作成したモデルを社内既存システムや新規システムに実装するためのPythonとJava環境用の実行モジュールを自動生成します。

  • Python : Python Scoring Pipeline
  • Java : MOJO Scoring Pipeline
  • Python, Java環境用実行モジュール生成

時系列データ対応

データとデータの時間的な関係性が重要となる時系列データについてもモデル作成が可能です。時系列のデータセットに対して、 Driverless AIが時間の順序を自動で検出します。

必要に応じてユーザが任意で下記のような設定を変更することも可能です。

  • ※売上予測の場合
    • Group by columns:店舗と部門ごとに売上予測をしたい
    • How many weeks to predict:〇〇週間後の売上予測をしたい
    • When should we start predicting : 学習用データと検証用データとの時間差を〇〇週間つけたい
  • 時系列データ対応