こんな方におすすめの記事です

  • AI活用に向けて学習環境構築を検討している方
  • AIインフラ構築にお悩みの方
  • Kubernetesに興味をお持ちの方

この記事を読み終えるのに必要な時間

5分

はじめに

こんにちは、マクニカAI女子部のSambaです。


前回の導入編では、AI学習環境として導入したDGX-2について、インフラ構築を行った背景と選定ポイントをお伝えしました。
今回は、実際に現場で奮闘したエンジニア達による、AI学習環境の「具体的な構築内容や構築における3つのハードル」をお届けします。

 

 

(左からNVIDIA製品サポート:佐々木・戸田、IT部門:横川、Twistlock製品サポート:野口)

01 タスクフォースチームの結成と構築作業

— 初めに、今回プロジェクトに関わったメンバーそれぞれの役割分担について教えてください。

戸田:私と佐々木は、マクニカ クラビスカンパニーでNVIDIA製品をサポートするエンジニアです。実際の 構築作業 を行いました。
 
横川:IT部門で基幹システムの管理を行っています。今回新規システムを導入するにあたり、既存の システムの整備 や双方の 連携 を担当しました。
 
野口:マクニカネットワークスでTwistlockというコンテナ環境向けセキュリティ製品を担当しています。Kubernetes関連の知見 を生かして構築をサポートしました。

— 具体的にどのような構成で環境構築を進めたのでしょうか?

佐々木:構成は図1のとおり、