Categorías
- Todas las publicaciones 549
- Proyectos Prácticos de Código Abierto 478
- Artículos Tutoriales 22
- Utilidades en Línea 13
- Noticias de IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Plantillas de Prompts 5
- Espacios de Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- Mis Favoritos 0
Publicaciones etiquetadas con: Open Source
Content related to Open Source
Lark-CLI: CLI oficial de Lark/Feishu para Agentes de IA
Descubre lark-cli, la CLI de código abierto oficial para las plataformas Lark/Feishu. Diseñada para humanos y agentes de IA por igual, ofrece más de 200 comandos en 12 dominios de negocio, incluyendo Calendario, Mensajería, Documentos, Hojas de cálculo, Correo y Tareas. Con 20 Habilidades de Agente de IA estructuradas, diseño nativo para agentes e integración sin configuración, ponte en marcha en 3 minutos. Incluye arquitectura de tres capas (atajos → comandos API → APIs crudas), seguridad de nivel empresarial y licencia MIT. Perfecta para desarrolladores que automatizan flujos de trabajo de Lark.
SentrySearch: Búsqueda Semántica de Video con IA
Descubre SentrySearch, la herramienta de código abierto que transforma horas de grabaciones de video en clips buscables usando la API de Gemini Embedding de Google o modelos locales Qwen3-VL. Solo escribe 'camión rojo pasando un semáforo de stop' y obtén clips de video perfectamente recortados. Perfecto para análisis de dashcam de Tesla, grabaciones de seguridad o cualquier archivo MP4/MOV. Incluye aceleración GPU local, superposiciones de metadatos de Tesla y salto automático de fotogramas estáticos para ahorrar costes y tiempo.
Puerto de Claude Code en Python: Reescritura de Código Abierto
Descubre el puerto independiente en Python de Claude Code – una reescritura desde cero usando oh-my-codex (OmX). Este proyecto educativo transforma el código base original en TypeScript en un espacio de trabajo prioritario en Python con herramientas CLI, pruebas completas y manifiestos detallados del puerto. Ejecuta `python3 -m src.main summary` para explorar el progreso, o profundiza en el ensayo ético sobre reimplementación de IA y erosión del copyleft. Perfecto para desarrolladores que estudian flujos de trabajo de agentes de IA, integración de herramientas y prácticas éticas de código abierto.
Pipeline automático para YouTube Shorts: De tema a video publicado
Transforma cualquier tema en un YouTube Short publicado en minutos con este pipeline completamente automatizado. Desde el descubrimiento de temas en tendencia (Reddit, Google Trends, TikTok) hasta guiones generados por IA (Claude), visuales (Gemini Imagen), voces en off (ElevenLabs), subtítulos incrustados, reducción de música y subida directa a YouTube. La v2.1.0 incluye capacidad de reanudación, lógica de reintentos, 78 pruebas y cuesta solo $0.11 por video. Perfecto para creadores que escalan contenido de formato corto.
Entrenamiento en Rust de Microsoft: 7 Libros para Todos los Niveles
El repositorio GitHub de RustTraining de Microsoft ofrece 7 libros completos adaptados para desarrolladores de C/C++, C# y Python que transitan a Rust, más profundizaciones en async, patrones, corrección impulsada por tipos y prácticas de ingeniería. Con 15-16 capítulos por libro que incluyen diagramas Mermaid, playgrounds editables, ejercicios y búsqueda de texto completo, este es el camino de aprendizaje estructurado definitivo en Rust desde puentes para principiantes hasta técnicas expertas. Clona y sirve localmente para acceso offline con búsqueda instantánea.
Helios: Generación de Video en Tiempo Real de 14B a 19,5 FPS
Descubre Helios, el modelo de generación de video de 14B parámetros de PKU-YuanGroup que genera videos de alta calidad de escala de minutos a 19,5 FPS en una sola GPU H100. Sin trucos anti-deriva, sin hacks de aceleración - solo innovación arquitectónica pura. Soporta T2V, I2V, V2V y generación interactiva con soporte Día-0 para Diffusers, SGLang, vLLM-Omni y Ascend NPU. Ejecútalo localmente con ~6GB VRAM usando offloading de grupo. Código completo de entrenamiento y tres variantes de modelo (Base, Mid, Distilled) disponibles ahora.
Recordly: Grabador de pantalla de código abierto con edición profesional
Recordly revoluciona la grabación de pantalla con herramientas de edición profesional integradas. Captura tu pantalla o ventana, luego edita instantáneamente con zooms automáticos, efectos de cursor suaves, superposiciones dinámicas de webcam, recorte de línea de tiempo y fotogramas estilizados. Exporta MP4 o GIF pulidos listos para tutoriales, demos y clips sociales. El soporte multiplataforma para macOS, Windows y Linux lo hace accesible para todos los desarrolladores y creadores de contenido. ¡Descubre por qué 3.1k estrellas no pueden estar equivocadas!
VoiceChanger: Conversión de Voz en Tiempo Real de Código Abierto
Descubre cómo VoiceChanger te permite transformar la voz al instante utilizando modelos de IA de vanguardia como Beatrice y RVC. Este proyecto de código abierto cuenta con una GUI multiplataforma, soporte Docker, modo red y tutoriales para AMD Linux y Google Colab. Ya sea que seas desarrollador de juegos, streamer o aficionado, aprende a instalar, configurar y actualizar el software en minutos y explora el emocionante mundo de la manipulación de voz en tiempo real.
EasyOCR: Una biblioteca OCR rápida y multilingüe para Python
EasyOCR trae soporte para más de 80 idiomas directamente a tus proyectos Python. Con una rápida instalación vía pip, descargas de modelos ligeros y una API intuitiva, puedes extraer texto de imágenes en segundos. Esta guía cubre todo, desde el uso básico y conjuntos de idiomas personalizados hasta despliegue con Docker e integración con Hugging Face Space. Ya sea que estés construyendo una herramienta de gestión de fotos o una canalización de entrada de datos, EasyOCR te brinda la velocidad y precisión que necesitas.
VibeVoice: El conjunto de herramientas de IA de voz de código abierto de Microsoft
Explora VibeVoice, el kit de herramientas de código abierto de vanguardia de Microsoft que ofrece ASR de larga duración, TTS multihablante y streaming en tiempo real a desarrolladores e investigadores. Aprende a aprovechar su canal de ASR de 60 minutos, su TTS de 90 minutos y su modelo ligero en tiempo real, y descubre la integración con Hugging Face Transformers para un despliegue sin problemas.