Instructor: La biblioteca de Python líder para resultados estructurados de LLMs

En el panorama en constante evolución de la inteligencia artificial, extraer datos confiables y estructurados de los Grandes Modelos de Lenguaje (LLM) sigue siendo un desafío considerable. Aquí es donde entra Instructor, la biblioteca de Python de código abierto líder diseñada para simplificar esta compleja tarea. Con más de 3 millones de descargas mensuales y una comunidad vibrante, Instructor se ha convertido en la solución de referencia para desarrolladores que buscan resultados seguros, validados y reintentados automáticamente de sus modelos de IA.

¿Qué es Instructor?

Instructor está construido sobre Pydantic, una potente biblioteca de validación de datos, para proporcionar un marco intuitivo y robusto para interactuar con los LLM. Permite a los desarrolladores definir la estructura exacta de los datos que necesitan utilizando modelos Pydantic. Esto asegura que los resultados de los LLM no solo sean consistentes, sino que también se adhieran a esquemas predefinidos, lo que reduce significativamente los errores y mejora la calidad de los datos.

Características clave:

Resultados Estructurados: Define modelos Pydantic para especificar con precisión el formato de datos deseado de tus LLM.
Reintentos Automáticos: Lógica integrada para reintentos automáticos cuando la validación falla, eliminando la necesidad de manejo manual de errores.
Validación de Datos: Aprovecha las robustas capacidades de validación de Pydantic para garantizar la calidad e integridad de las respuestas de los LLM.
Soporte para Streaming: Procesamiento en tiempo real de respuestas parciales y listas para una mayor capacidad de respuesta de la aplicación.
Compatibilidad con Múltiples Proveedores: Funciona sin problemas con más de 15 proveedores de LLM, incluyendo OpenAI, Anthropic, Google (Gemini), Mistral, Cohere, Ollama, DeepSeek y muchos más, ofreciendo una API unificada.
Seguridad de Tipos: Disfruta de soporte completo del IDE con inferencia de tipos adecuada y autocompletado, aumentando la productividad del desarrollador.
Soporte de Código Abierto: Ejecuta cualquier modelo de código abierto localmente usando frameworks como Ollama, llama-cpp-python o vLLM.

Inicio Rápido: Extrae Datos Estructurados en 3 Líneas

Comenzar a usar Instructor es increíblemente sencillo. Después de la instalación, puedes extraer datos estructurados casi al instante:

import instructor
from pydantic import BaseModel
from openai import OpenAI

class Person(BaseModel):
    name: str
    age: int
    occupation: str

client = instructor.from_openai(OpenAI())
person = client.chat.completions.create(
    model="gpt-4o-mini"