NitroGen: Modelo de Base de IA Abierta para Agentes de Videojuegos
Introducción
Los videojuegos han sido desde hace mucho tiempo un escenario de prueba para la investigación en inteligencia artificial. Desde bots basados en reglas simples hasta agentes sofisticados de aprendizaje por refuerzo, los desarrolladores continúan empujando los límites de lo que una computadora puede hacer en un mundo virtual. NitroGen de NVIDIA lleva esta ambición un paso más allá: un modelo de base abierto que puede jugar una amplia gama de videojuegos directamente desde la entrada de píxeles.
En este artículo exploramos el diseño, los datos de entrenamiento y el uso práctico de NitroGen. Ya seas investigador, aficionado o desarrollador de videojuegos interesado en IA, encontrarás una hoja de ruta clara para instalar y poner en marcha NitroGen en tu máquina.
¿Qué es NitroGen?
- Modelo de base de código abierto: El código y los pesos están disponibles de forma libre en GitHub y Hugging Face.
- Agente de videojuegos generalista: NitroGen no está afinado para un solo título; aprende de un conjunto de datos masivo de videojuegos con acción obtenido completamente de internet.
- Arquitectura de clonación de comportamiento: El modelo imita el juego humano reproduciendo las acciones que producían los fotogramas registrados.
- Pixel a control: La entrada son píxeles RGB crudos; la salida son comandos discretos de gamepad adecuados para la mayoría de los juegos de Windows.
El documento de investigación del proyecto (Magne et al., 2026) detalla la construcción del conjunto de datos y la arquitectura del modelo. La versión de código abierto permite a la comunidad adaptar, ampliar y validar el modelo en nuevos juegos.
Entrenamiento y Datos
NitroGen fue entrenado con más de 1 millón de horas de juego capturado de videos disponibles públicamente. Puntos clave:
- Tamaño del conjunto de datos – El gran tamaño es crítico para un modelo generalista. La diversidad de juegos, ángulos de cámara y estilos de jugadores enseña a la red a generalizar.
- Clonación de comportamiento – Por cada fotograma, las etiquetas de acción originales (por ejemplo, pulsaciones de botones) se extraen. El modelo aprende a mapear imagen → acción.
- Normalización y aumento – Los fotogramas crudos se escalan a 84×84 y se normalizan. El aumento de datos incluye recortes aleatorios y cambios de brillo para mejorar la robustez.
A causa de que el modelo fue entrenado íntegramente con videos de internet, el código está totalmente libre de binarios de videojuegos con derechos de autor. Tú proporcionas el ejecutable en un paso posterior.
Guía de Instalación
Debajo se presentan instrucciones paso a paso para instalar NitroGen en una computadora portátil con Windows o un servidor Linux.
1. Clonar el Repositorio
git clone https://github.com/MineDojo/NitroGen.git
cd NitroGen
2. Crear un entorno Python
Recomendamos usar Python ≥ 3.12 (consulta el pyproject.toml del repositorio).
python -m venv venv
source venv/bin/activate # En Windows: venv\\Scripts\\activate
pip install -e . # Instala dependencias y el paquete local
3. Descargar el punto de control preentrenado
El punto de control se encuentra en Hugging Face bajo el repositorio nvidia/NitroGen.
hf download nvidia/NitroGen ng.pt
ng.pt puede moverse a donde prefieras; el script del servidor espera una ruta a él.
4. Ejecutar el Servidor de Inferencia
python scripts/serve.py <path_to_ng.pt>
8000 y escucha peticiones de inferencia.
5. Jugar a un Juego
Debes tener instalado un juego de Windows. Encuentra el nombre exacto del ejecutable con el Administrador de tareas (Ctrl + Shift + Esc) → Detalles → Haz clic derecho → Propiedades.
python scripts/play.py --process 'mygame.exe'
mygame.exe con el nombre real del proceso. El script captura la pantalla, envía fotogramas al servidor de inferencia y traduce las predicciones a entradas del controlador.
Consejo: Si tu juego usa DirectX 11 o superior, la rutina de captura de pantalla de NitroGen funciona bien. Para títulos de baja frecuencia de fotogramas, considera aumentar la frecuencia de captura en
scripts/play.py.
Características clave y limitaciones
| Característica | Descripción |
|---|---|
| Multijuego | Funciona con cualquier juego de Windows mientras se ejecute como un .exe. |
| API Python | Arquitectura sencilla de servidor‑cliente; puede integrarse en pipelines personalizados. |
| Código abierto | No hay componentes cerrados; el código de investigación está disponible bajo la licencia MIT. |
| Sin binarios de juegos | Proporcionas el juego; no hay conflictos de licencias. |
| Solo Windows | Los juegos deben ejecutarse en Windows; el servidor de inferencia puede ejecutarse en Linux. |
| Limitaciones de clonación de comportamiento | Si el conjunto de acciones del juego difiere de los datos de entrenamiento, es posible que necesites afinación. |
Ampliando NitroGen
- Afinación en un nuevo título – Reúne un conjunto pequeño de videos de juego del título objetivo y utiliza el script
train.pyprovisto para adaptar el modelo. - Espacios de acción personalizados – Modifica la definición
action_spaceen la configuración de entrenamiento para coincidir con un nuevo esquema de controlador. - Multi‑CPU/ GPU – El servidor es de un solo hilo; puedes desplegar múltiples instancias detrás de un balanceador de carga para mayor rendimiento.
Para instrucciones detalladas, consulta el directorio docs/ en el repositorio.
Cómo contribuir
- Informes de errores – Presentar incidencias en GitHub.
- Solicitudes de extracción (Pull Requests) – Mejoras de código, nuevas recetas de entrenamiento o scripts de demostración adicionales. Por favor, sigue las pautas de contribución en
CONTRIBUTING.md. - Discusión comunitaria – Únete al canal Slack de NVIDIA AI Research o al Discord
#nitrogenpara ayuda en tiempo real.
Resumen
NitroGen demuestra que un único modelo de base puede manejar una sorprendentemente amplia gama de juegos a nivel de píxeles. Al construir sobre un repositorio de código abierto, NVIDIA invita a la comunidad de investigación a probar, ampliar y remezclar la tecnología.
Ya sea que estés probando los límites de la clonación de comportamiento o quieras un agente listo para usar en un pipeline de pruebas de videojuegos, NitroGen ofrece un punto de partida sólido y bien documentado.
Clona el repositorio hoy, ejecuta tu primer juego y únete a la conversación sobre IA abierta en los videojuegos. ¡Feliz juego!
Citation (for academic use):
@misc{magne2026nitrogen,
title={NitroGen: An Open Foundation Model for Generalist Gaming Agents},
author={Loïc Magne and Anas Awadalla and Guanzhi Wang and Yinzhen Xu and Joshua Belofsky and Fengyuan Hu and Joohwan Kim and Ludwig Schmidt and Georgia Gkioxari and Jan Kautz and Yisong Yue and Yejin Choi and Yuke Zhu and Linxi "Jim" Fan},
year={2026},
eprint={2601.02427},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.02427},
}