Categorías
- Todas las publicaciones 549
- Proyectos Prácticos de Código Abierto 478
- Artículos Tutoriales 22
- Utilidades en Línea 13
- Noticias de IA 7
- Tiny Startups Showcase 7
- Claude Code Skills 6
- Plantillas de Prompts 5
- Espacios de Hugging Face 3
- OpenClaw Use Cases 3
- LLM Learning Resources 1
- Online AI Image Tools 1
- OpenClaw Master Skills Collection 1
- Rust Training Resources 1
- AI Short Drama Tools 1
- Mis Favoritos 0
Publicaciones etiquetadas con: Open Source
Content related to Open Source
Dev Browser: Automatización de Navegadores con Estado para Claude Code
Descubre cómo Dev Browser convierte a Claude Code en una poderosa herramienta de automatización web. Permite que las páginas persistan entre scripts, controla Chrome mediante una extensión opcional y compáralo en velocidad y costo con las soluciones de Playwright. Esta guía cubre la instalación, las características, los benchmarks y casos de uso reales, asegurando que puedas aumentar la productividad de los agentes con la mínima complicación.
NexaSDK: Ejecuta IA Multimodal en el Dispositivo con Modelos Day‑0
Descubre NexaSDK, el framework de IA de alto rendimiento para dispositivos que permite a los desarrolladores desplegar LLMs, VLMs, ASR, OCR y más en Android, iOS, Windows, macOS, Linux y dispositivos IoT integrados, todo con una sola línea de código. Desde el soporte de modelos Day‑0 para Qwen3‑VL hasta la aceleración NPU de Qualcomm Hexagon, NexaSDK ofrece rendimiento de vanguardia, conveniencia de plataforma cruzada y una licencia Apache‑2.0. Ya sea que estés creando un chatbot móvil, un clasificador de imágenes en tiempo real o un hub de IA basado en Linux, esta guía explica por qué NexaSDK es la solución de código abierto preferida para cargas de trabajo de IA modernas.
Voice‑Pro: Estudio de doblaje de IA de código abierto para medios multilingües
Descubre Voice‑Pro, una interfaz web de código abierto completa que desbloquea un potente TTS, clonación de voz sin entrenamiento (zero‑shot) y traducción multilingüe instantánea. Desde el reconocimiento de voz basado en Whisper hasta Edge‑TTS, E2‑TTS, F5‑TTS, CosyVoice y kokoro, Voice‑Pro cubre más de 100 idiomas y 400 voces, todo en una sola plataforma. También incorpora descarga de YouTube, aislamiento vocal con Demucs y generación de subtítulos. Aprende a instalar, ejecutar y personalizar Voice‑Pro en Windows, macOS o Linux, y observa ejemplos del mundo real que superan a las soluciones SaaS populares para doblaje, producción de podcasts y creación de subtítulos.
Sopro – Texto‑a‑Voz ligero con clonación de voz zero-shot
Descubre Sopro, el modelo TTS inglés ligero construido sobre convoluciones dilatadas estilo WaveNet. Con solo 169 M parámetros, ofrece síntesis rápida en streaming y clonación de voz zero-shot a partir de solo unos pocos segundos de audio. Aprende cómo instalarlo, ejecutarlo desde la CLI, o integrarlo en Python, y explora la interfaz web de demostración. Ideal para desarrolladores que desean un TTS rápido y flexible sin la pesada carga del Transformer.
Pyarmor: La herramienta definitiva de ofuscación de scripts Python para 2025
Protege tu código Python con Pyarmor, la herramienta de ofuscación open‑source líder que convierte scripts simples en archivos seguros, vinculados a la máquina y con fecha de expiración. Aprende a instalar, ofuscar y vincular tus proyectos sin esfuerzo en Windows, macOS y Linux. Descubre funciones avanzadas como la conversión de funciones C, protección Themida y soporte multiplataforma—todo en esta guía completa.
VideoLingo: Convierte cualquier video en subtítulos y doblaje de calidad Netflix con un solo clic
VideoLingo es la solución definitiva de código abierto para automatizar subtítulos, traducciones y doblajes de videos. Al aprovechar WhisperX para la transcripción a nivel de palabra, GPT‑SoVITS para la clonación de voz y una interfaz Streamlit fluida, ofrece subtítulos de estándar Netflix, de línea única, con soporte multilingüe—todo con un solo clic. En este artículo exploramos sus características, instalación, soporte Docker y casos de uso en el mundo real, demostrando cómo esta herramienta puede transformar tu flujo de trabajo de video y abrir la puerta a audiencias globales.
AI‑Video‑Transcriber: Transcribe y Resume Cualquier Video con IA
Descubre cómo AI‑Video‑Transcriber trae la próxima generación de transcripción de voz a texto y resumen impulsado por IA a cada plataforma de video. Con Faster‑Whisper, FastAPI y una traducción opcional de OpenAI GPT‑4o, admite más de 30 sitios, incluidos YouTube, TikTok, Bilibili, y más de 100 idiomas. Aprende a instalarlo vía Docker o scripts, configura los modelos Whisper y optimiza el rendimiento para contenido de larga duración. Ideal para desarrolladores, creadores de contenido e investigadores que buscan una solución lista para usar, de código abierto, que escale desde portátiles hasta servidores en la nube.
Vibium: Automatización de Navegadores sin Configuración para Agentes de IA
Descubre Vibium, el binario Go ligero que lleva la automatización de navegadores a agentes de IA y desarrolladores sin la típica molestia de configuración. Construido sobre WebDriver BiDi, Vibium ofrece un sencillo servidor MCP, Chrome auto‑instalable y una API dual sincrónica/asincrónica JS/TS y Python. Ya sea que estés construyendo un agente Claude Code, escribiendo pruebas de extremo a extremo o automatizando tareas rutinarias, Vibium te permite lanzar, navegar, hacer clic, escribir y capturar pantalla con una sola línea de código. Sigue nuestra guía de inicio rápido, explora scripts de ejemplo y aprende cómo el diseño “visible por defecto” y el enfoque sin configuración de Vibium simplifican la automatización para que puedas centrarte en la innovación en lugar de la infraestructura.
rag‑chunk: Herramienta CLI para evaluar y optimizar la fragmentación RAG
Rag‑chunk es una utilidad ligera basada en Python que permite a científicos de datos e ingenieros de aprendizaje automático probar, evaluar y refinar estrategias de fragmentación para Retrieval‑Augmented Generation (RAG). Con soporte para fragmentación de tamaño fijo, ventana deslizante, párrafo e incluso partición recursiva por carácter, puedes comparar puntuaciones de recuperación, ajustar los límites basados en tokens con tiktoken y exportar resultados en tablas, JSON o CSV. Este artículo guía a través de la instalación, características clave, ejemplos del mundo real y consejos para elegir la mejor estrategia para tus documentos Markdown. Ya sea que estés prototipando una nueva tubería RAG o afinando un sistema de lectura en producción, rag‑chunk te brinda los datos necesarios para tomar decisiones informadas.
Edhita: Editor de texto iOS SwiftUI de código abierto para desarrolladores
Explora Edhita, el editor de texto totalmente de código abierto para iOS construido con SwiftUI. Conoce sus funciones esenciales, cómo integra AdMob y las políticas de privacidad, y por qué es un proyecto de inicio ideal para desarrolladores de Swift. El artículo recorre la configuración del repositorio, la construcción de la aplicación en Xcode y la personalización del editor para uso personal. Ya seas un ingeniero iOS experimentado o estás empezando, descubre cómo el código moderno de Edhita, su interfaz limpia y su comunidad activa pueden acelerar tu curva de aprendizaje y potenciar tus propios proyectos de editores.