NitroGen:ゲームエージェント向けのオープンAIファウンデーションモデル
はじめに
ゲームは長らく人工知能研究の遊び場として機能しています。シンプルなルールベースのボットから洗練された強化学習エージェントに至るまで、開発者は仮想世界でコンピュータが実行できることの境界を常に押し広げています。NVIDIAの NitroGen はその野心をさらに一歩進め、ピクセル入力から直接さまざまなビデオゲームをプレイできる オープンファウンデーションモデル を提供します。
本記事では NitroGen の設計、トレーニングデータ、および実践的な使い方を探ります。研究者、趣味人、または AI に興味を持つゲーム開発者の皆さんも、NitroGen を自分のマシンで動かすための明確なロードマップを見つけられるでしょう。
NitroGen とは
- オープンソースのファウンデーションモデル:コードと重みは GitHub と Hugging Face で無料公開されています。
- 汎用ゲームエージェント:NitroGen は特定のタイトルに合わせてチューニングされておらず、インターネットから完全に収集された 巨大なビデオアクションゲームプレイデータセット から学習します。
- 行動クローンニングアーキテクチャ:モデルは、記録されたゲームプレイフレームを生成したアクションを再現することで、人間のプレイを模倣します。
- ピクセル→制御:入力は生のRGBピクセルで、出力はほとんどの Windows ゲームに適した離散的なゲームパッドコマンドです。
本プロジェクトの研究論文(Magne et al., 2026)はデータセットの構築とモデルアーキテクチャの詳細を示しています。オープンソースリリースにより、コミュニティはモデルを新しいゲームに適応・拡張・検証できるようになります。
トレーニングとデータ
NitroGen は公開済みビデオから取得した 100万時間以上 のゲームプレイデータで訓練されました。主要ポイント:
- データセットサイズ – 大規模さは汎用モデルにとって不可欠です。ゲーム、カメラ角度、プレイヤースタイルの多様性がネットワークに汎化を教えます。
- 行動クローンニング – 各フレームで元のアクションラベル(例:ボタン押下)が抽出されます。モデルは画像 → アクションをマッピングする学習を行います。
- 正規化と拡張 – 生フレームは 84×84 にリサイズされ正規化されます。データ拡張ではランダムクロッピングや明るさ変更を行い頑健性を高めます。
モデルは完全にインターネットビデオで訓練されたため、コードは著作権付きゲームバイナリを一切含みません。実行可能ファイルは後続のステップで提供してください。
インストールガイド
以下は、Windows ラップトップまたは Linux サーバーに NitroGen を導入するためのステップ・バイ・ステップの手順です。
1. リポジトリをクローン
git clone https://github.com/MineDojo/NitroGen.git
cd NitroGen
2. Python 環境を作成
Python ≥ 3.12 の使用を推奨します(リポジトリの pyproject.toml を参照)。
python -m venv venv
source venv/bin/activate # On Windows: venv\Scripts\activate
pip install -e . # Installs dependencies and the local package
3. 事前訓練済みチェックポイントをダウンロード
チェックポイントは Hugging Face の nvidia/NitroGen リポジトリにあります。
hf download nvidia/NitroGen ng.pt
ng.pt ファイルは好きな場所へ移動できます。サーバースクリプトはそのパスを期待します。
4. 推論サーバーを起動
python scripts/serve.py <path_to_ng.pt>
8000 で起動し、推論リクエストを待ち受けます。
5. ゲームをプレイ
Windows 上にゲームがインストールされている必要があります。タスクマネージャー(Ctrl + Shift + Esc)で実行ファイル名を確認し、詳細 → 右クリック → プロパティ を選択します。
python scripts/play.py --process 'mygame.exe'
mygame.exe を実際のプロセス名に置き換えてください。スクリプトは画面をキャプチャし、フレームを推論サーバーへ送信し、予測をコントローラ入力へ変換します。
Tip:ゲームが DirectX 11 以上を使用している場合、NitroGen のスクリーンキャプチャルーチンは優れた性能を発揮します。低フレームレートタイトルの場合は
scripts/play.pyのキャプチャ頻度を増やすことを検討してください。
主な機能と制約
| 機能 | 説明 |
|---|---|
| クロスゲーム | .exe として動作する任意の Windows ゲームに対応します。 |
| Python API | シンプルなサーバー‑クライアント構成で、カスタムパイプラインに統合できます。 |
| オープンソース | . MIT ライセンスの下で公開されているため、閉じたコンポーネントはありません。 |
| ゲームバイナリなし | ゲームはユーザーが提供し、ライセンス上の衝突はありません。 |
| Windows限定 | ゲームは Windows 上で動作する必要がありますが、サーバー推論は Linux 上で実行可能です。 |
| 行動クローンニングの制限 | ゲームのアクションセットが訓練データと異なる場合は、微調整が必要になる可能性があります。 |
NitroGen の拡張
- 新タイトルでの微調整 – 対象ゲームの少量のゲームプレイビデオを収集し、提供された
train.pyスクリプトを使用してモデルを適応させます。 - カスタムアクションスペース – 学習設定の
action_space定義を新しいコントローラースキーマに合わせて変更します。 - マルチCPU/ GPU – サーバーは単一スレッドで動作しますが、ロードバランサーの背後に複数インスタンスをデプロイしてスループットを向上させることができます。
詳細な手順はリポジトリ内の
docs/ディレクトリを参照してください。
参加方法
- バグ報告 – GitHub に問題を提出します。
- Pull Request – コード改善、新しいトレーニングレシピ、追加デモスクリプト。
CONTRIBUTING.mdの貢献ガイドラインに従ってください。 - コミュニティディスカッション – NVIDIA AI Research Slack チャンネルや
#nitrogenDiscord に参加し、リアルタイムでヘルプを受けてください。
要約
NitroGen は、単一のファウンデーションモデルでピクセルレベルで驚くほど幅広いゲームを扱えることを示しています。オープンソースリポジトリを基盤に、NVIDIA は研究コミュニティに技術をテスト、拡張、リミックスするよう招待しています。
行動クローンニングの限界に挑戦する場合でも、ゲームテストパイプライン用の既成エージェントを求めている場合でも、NitroGen は堅牢でよく文書化された出発点を提供します。今日リポジトリをクローンし、初めてのゲームを実行し、オープンゲームAIに関するディスカッションに参加してください。楽しいゲームプレイを!
Citation (for academic use):
@misc{magne2026nitrogen,
title={NitroGen: An Open Foundation Model for Generalist Gaming Agents},
author={Loïc Magne and Anas Awadalla and Guanzhi Wang and Yinzhen Xu and Joshua Belofsky and Fengyuan Hu and Joohwan Kim and Ludwig Schmidt and Georgia Gkioxari and Jan Kautz and Yisong Yue and Yejin Choi and Yuke Zhu and Linxi "Jim" Fan},
year={2026},
eprint={2601.02427},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.02427},
}