AIBit-Descubre proyectos de código abierto AIBit-Descubre proyectos de código abierto
Proyectos de código abiertoWeb Scraping y DatosAgentes de IA y AutomatizaciónHerramientas y recursos de IA
Más
Aprendizaje y tutorialesInvestigación y Benchmarks de IADesarrollo y SeguridadWeb e InfraestructuraCreación de Medios y ContenidoHardware e IA en el bordeRecursos para Startups
AIBit-Descubre proyectos de código abierto › Investigación y Benchmarks de IA› RAG e investigación de datos

9 de abril de 2026

Zvec: Base de datos vectorial in-process ultrarrápida de Alibaba

Descubre Zvec, la base de datos vectorial de código abierto de Alibaba que se integra directamente en tus apps sin necesidad de servidores. Busca miles de millones de vectores en milisegundos, soporta embeddings densos/esparsos, búsqueda híbrida y funciona en cualquier lugar: desde notebooks hasta dispositivos edge. La última v0.3.0 añade soporte para Windows/Android, cuantización RabitQ y C-API para agentes de IA. Instala vía pip o npm y comienza a construir apps RAG hoy con esta potencia ligera de grado de producción que presume 9.3k estrellas en GitHub.

  • 8 abr 2026

    txtai: Framework de IA Todo-en-Uno para RAG y Agentes

    Descubre txtai, el framework de IA de código abierto definitivo que combina búsqueda semántica, orquestación de LLM, agentes autónomos y pipelines RAG. Construye aplicaciones de IA listas para producción con búsqueda vectorial, embeddings multimodales y automatización de flujos de trabajo. Empieza en minutos con pip install txtai y explora más de 70 notebooks de Colab que cubren desde grafos semánticos hasta RAG de voz a voz.

  • 3 abr 2026

    SentrySearch: Búsqueda Semántica de Video con IA

    Descubre SentrySearch, la herramienta de código abierto que transforma horas de grabaciones de video en clips buscables usando la API de Gemini Embedding de Google o modelos locales Qwen3-VL. Solo escribe 'camión rojo pasando un semáforo de stop' y obtén clips de video perfectamente recortados. Perfecto para análisis de dashcam de Tesla, grabaciones de seguridad o cualquier archivo MP4/MOV. Incluye aceleración GPU local, superposiciones de metadatos de Tesla y salto automático de fotogramas estáticos para ahorrar costes y tiempo.

  • 29 mar 2026

    TurboQuant+: Compresión de Caché KV 6.4x para LLMs

    TurboQuant+ implementa el avance de compresión de caché KV de ICLR 2026, logrando compresión 4.6-6.4x con calidad y velocidad cercanas a q8_0. Incluye formatos turbo2/turbo3/turbo4, decodificación Sparse V con puerta de atención (+22.8% velocidad de decodificación) e integración completa con llama.cpp Metal. Ejecuta Qwen 3.5 35B-A3B en M5 Max con 93.9% recuperación NIAH y velocidad de prefill 1.02x q8_0. Prototipo Python completo con más de 511 pruebas y validación comunitaria en Apple Silicon, NVIDIA y AMD.

  • 3 mar 2026

    br/acc: El Grafo Abierto de Brasil para Inteligencia Cívica

    Descubre br/acc, la infraestructura de grafo de código abierto que unifica las bases de datos públicas dispersas de Brasil en un solo grafo Neo4j consultable. Desde registros de empresas y datos de adquisiciones hasta registros de salud y sanciones ambientales, este proyecto descentralizado hace que los datos gubernamentales sean accionables para la mejora cívica. Incluye 45+ tuberías ETL, frontend React, backend FastAPI y bootstrap Docker en un comando. Cumple con LGPD y prioriza la privacidad, está listo para desarrollo local con make bootstrap-demo.

  • 20 feb 2026

    Dash: Agente de Datos Autoaprendiz con 6 Capas de Contexto

    Descubre Dash, un agente de datos autoaprendiz que fundamenta sus respuestas en seis capas de contexto. Aprende cómo configurarlo localmente o en Railway, cómo el agente emplea búsqueda híbrida para generar SQL correctos y cómo mejora continuamente sin reentrenamiento. El artículo guía paso a paso sobre la instalación, carga de datos, organización del conocimiento y ejemplos de consultas reales, ofreciendo una guía práctica para desarrolladores que crean herramientas de datos impulsadas por IA.

  • 12 feb 2026

    World Monitor: Panel de Inteligencia Global impulsado por IA y de código abierto

    World Monitor es una plataforma gratuita y de código abierto que unifica noticias en tiempo real, imágenes satelitales, datos de vuelos militares y flujos de mercado en un único mapa interactivo. Con LLMs para la summarización, clasificación híbrida de amenazas y detección de anomalías, ofrece conciencia situacional accionable para gobiernos, investigadores y periodistas. El tablero se construye con TypeScript, Vite y deck.gl, y puede auto‑alojarse o ejecutarse en la web. Sigue leyendo para descubrir cómo el sistema agrega más de 100 fuentes de datos, usa funciones edge para cachear y asegurar, y cómo puedes contribuir o desplegar tu propia instancia.

  • 6 feb 2026

    Web Search MCP Server: Búsqueda Web Local de LLM sin Claves API

    Buscas darle a tus LLMs alojados localmente una potente capacidad de búsqueda web en local? El Servidor Web Search MCP ofrece una solución basada en TypeScript y controlada por navegador que extrae contenido en tiempo real de Bing, Brave, y DuckDuckGo. Proporciona tres herramientas dedicadas—full-web-search, get-web-search-summaries, y get-single-web-page-content—para que elijas entre extracción profunda de contenido o fragmentos rápidos. Este artículo te guía a través de la instalación, configuración, variables de entorno y ejemplos reales, además de consejos de solución de problemas y trucos de rendimiento, para que puedas integrar una búsqueda web rápida y confiable en cualquier flujo de trabajo local de LLM.

  • 11 jun 2025

    Common Crawl: Datos web libres y abiertos para todos

    Descubre Common Crawl, una organización sin ánimo de lucro que ofrece un repositorio masivo, gratuito y abierto de datos de rastreo web. Desde 2007, Common Crawl ha acumulado más de 250 mil millones de páginas, con 3 a 5 mil millones de páginas nuevas añadidas mensualmente, lo que lo convierte en un recurso inestimable para investigadores, desarrolladores y científicos de datos. Aprende cómo este extenso conjunto de datos ha sido citado en más de 10.000 artículos de investigación y continúa apoyando avances en inteligencia artificial, modelos de lenguaje y análisis web. Explora sus últimos grafos web y comprende el impacto de este proyecto fundamental de código abierto.

  • 10 jun 2025

    Domina las Técnicas Avanzadas de RAG: Un Repositorio de GitHub

    Adéntrate en el mundo de la Generación Aumentada por Recuperación (RAG) con un completo repositorio de GitHub que incluye técnicas avanzadas. Este recurso te ofrece implementaciones prácticas y tutoriales, abarcando desde el RAG fundacional, la mejora de consultas y el enriquecimiento contextual, hasta métodos de recuperación avanzados. Es perfecto para desarrolladores e investigadores que buscan potenciar sus sistemas RAG, e incluye scripts ejecutables, explicaciones detalladas y ejemplos de integración con frameworks populares como LangChain y LlamaIndex. Explora enfoques de vanguardia como Graph RAG, Self-RAG y Corrective RAG, junto con metodologías de evaluación para afinar tus aplicaciones de IA. Únete a una comunidad vibrante y contribuye a este centro de conocimiento en evolución para la innovación en RAG.

  • 9 jun 2025

    RAGbits: Desarrollo Rápido para Aplicaciones de GenAI

    Descubre RAGbits, un framework de código abierto diseñado para acelerar el desarrollo de aplicaciones de IA generativa fiables y escalables. Esta innovadora caja de herramientas ofrece componentes modulares para construir sofisticados pipelines RAG (Generación Aumentada por Recuperación), gestionar LLM e integrar diversas fuentes de datos. Aprende cómo RAGbits simplifica tareas complejas como la ingesta de datos, la gestión de bases de datos vectoriales y el despliegue de chatbots, permitiendo a los desarrolladores crear soluciones de IA robustas de manera eficiente. Explora sus características, incluyendo llamadas LLM con tipado seguro, amplio soporte de formatos y herramientas de prueba integradas, para agilizar tus proyectos de GenAI.

  • 3 jun 2025

    MinerU: Transforme documentos no estructurados en conocimiento accesible con minería basada en la nube

    MinerU: Una plataforma de minería de conocimiento en la nube que te ayuda a extraer información valiosa de documentos. Sube archivos, haz preguntas y recibe respuestas precisas con citas. Perfecta para investigadores, profesionales y educadores que buscan una recuperación eficiente de información.

Herramientas de IA, proyectos de código abierto, tutoriales y recursos seleccionados para desarrolladores que trabajan con inteligencia artificial.

Términos de servicio Política de privacidad © 2026 AIBit-Descubre proyectos de código abierto