RAG - 开源项目

终极 LLM 学习指南：70+ 份 PDF 从基础到进阶

March 04, 2026

标签:

RAG LLM Learning AI Study Guide LLM Tutorials RLHF

发现「Teaching Boyfriend LLM」——终极 GitHub 仓库，包含 70+ 份中文 PDF 讲义，覆盖 LLM 基础、微调、RLHF、RAG、Agents、推理优化，以及前沿模型如 DeepSeek R1、Qwen3、Llama3。完美适合开发者、学生和 AI 工程师，从零到专家的系统路径。按主题组织，清晰难度评级和学习进度。

阅读更多原文

实用开源项目

PageIndex：开源的基于推理的 RAG 框架

January 29, 2026

标签:

Open Source Python LLM RAG vectorless

发现 PageIndex —— 一款突破性的开源工具，消除了检索增强生成（RAG）中对向量数据库的需求。通过构建层级树索引并利用 LLM 推理，PageIndex 实现了类人检索，无需分块或向量相似度。本文深入阐述其核心概念、安装步骤、实用用例——尤其是金融与法律文档分析——以及令人印象深刻的基准结果。无论您是研究员、开发者还是数据科学家，都能学习如何用这款轻量级 Python 库将长篇 PDF 与 Markdown 文件转化为可操作的知识。

阅读更多原文

实用开源项目

FlashRAG：高效 RAG 研究的 Python 工具包

January 16, 2026

标签:

Python LLM RAG OpenSource Toolkit

FlashRAG 是一款前沿、MIT 许可的 Python 框架，将检索增强生成（RAG）研究从理论转化为实践。凭借 36 个预处理好的基准数据集、23 个前沿算法和轻量级 UI，研究人员可以在几分钟内原型并评估 RAG pipeline。无论您是构建自定义检索堆栈的数据科学家、探索基于推理方法的 LLM 开发者，还是想获得即时结果的业余爱好者，FlashRAG 的模块化设计、易于安装和丰富组件都使复杂的 RAG 工作变得可接近。了解如何设置环境、配置 pipeline，并利用工具包的推理方法进行多跳问答，同时为活跃的开源 RAG 爱好者社区贡献力量。

阅读更多原文

实用开源项目

rag‑chunk: CLI 工具，用于基准测试和优化 RAG 分块

January 16, 2026

标签:

Open Source RAG NLP chunking cli

rag‑chunk 是一个轻量级、基于 Python 的命令行工具，帮助数据科学家和机器学习工程师测试、基准化并完善检索增强生成（RAG）的分块策略。它支持固定大小、滑动窗口、段落，甚至递归字符拆分，你可以比较召回率、使用 tiktoken 调整令牌精确边界，并将结果导出为表格、JSON 或 CSV。本文介绍了安装、主要功能、实际案例，并提供挑选最佳策略的建议，帮助你为 Markdown 文档做出最佳选择。无论你是在原型新建 RAG 流水线，还是在生产环境中调优读取时系统，rag‑chunk 都能为你提供必要的数据，助你做出明智决策。

阅读更多原文

实用开源项目

DeepTutor：AI 驱动的个性化学习助手开源项目

January 16, 2026

标签:

Open Source RAG Multi-Agent Machine Learning AI Tutoring

DeepTutor 让前沿 AI 辅导触手可得。这款开源多智能体系统集成了 FastAPI、Next.js 与 RAG 流水线，提供即时问答、交互式可视化、个性化练习和研究生成工具。凭借完整的 Docker 支持、CLI 与直观的 Web 界面，开发者可快速启动个人 AI 辅导机器人，试验嵌入技术，或贡献新模块。了解其架构、安装流程、核心特性以及如何贡献，并加入正在塑造 AI 驱动学习未来的教育者和开发者社区。

阅读更多原文

实用开源项目

RAG-Anything：一体化多模态RAG框架

September 26, 2025

标签:

Open Source LLM RAG Information Retrieval Multimodal AI

探索 RAG-Anything，这是一个创新的开源框架，它通过全面支持多模态文档，彻底改变了检索增强生成（RAG）技术。这个尖端系统能够无缝处理文本、图像、表格和公式，从而克服了传统RAG的局限性。了解 RAG-Anything 如何在 LightRAG 的基础上，提供文档摄取、分析和智能查询的端到端管线，使其成为学术研究、技术文档和企业知识管理的不可或缺的工具。

阅读更多原文

实用开源项目

掌握高级RAG技巧：GitHub代码库

June 10, 2025

标签:

Open Source AI RAG NLP LLM Techniques

深入了解检索增强生成（RAG）的世界，这个全面的GitHub代码库汇集了各种先进技术。这里提供了实用的实现方案和教程，内容涵盖了RAG的基础知识、查询优化、上下文丰富以及高级检索方法。无论你是开发者还是研究人员，希望提升自己的RAG系统，这个资源都非常适合。其中包含了可运行脚本、详细解释，以及与LangChain和LlamaIndex等主流框架的集成示例。探索图RAG、自RAG和纠正性RAG等前沿方法，还有助于你优化AI应用的评估策略。欢迎加入这个充满活力的社区，共同为RAG的创新知识中心添砖加瓦。

阅读更多原文

实用开源项目

Langroid：Python 多智能体 LLM 框架

June 09, 2025

标签:

Python Open Source AI RAG LLM Framework Multi-Agent

探索 Langroid，这是一个直观、可扩展的 Python 框架，专为构建基于大型语言模型（LLM）的应用而设计。Langroid 由卡内基梅隆大学（CMU）和威斯康星大学麦迪逊分校（UW-Madison）的研究人员开发，它极大地简化了多智能体编程，让开发者能够轻松创建复杂的 AI 解决方案。不同于 LangChain 等其他 LLM 框架，Langroid 采用独特方法，通过智能体、任务以及丰富的工具和集成，赋能用户构建健壮的应用。对于任何对先进 LLM 开发和多智能体系统感兴趣的人来说，Langroid 都是一个不容错过的选择。

阅读更多原文

实用开源项目

RAGbits：加速GenAI应用开发

June 09, 2025

标签:

Open Source AI GenAI Framework RAG LLM Development Python AI

发现 RAGbits，一个开源框架，旨在加速可靠、可扩展的生成式 AI 应用的开发。这个创新工具包提供模块化组件，用于构建复杂的 RAG（检索增强生成）管道、管理大型语言模型（LLM）以及整合各种数据源。了解 RAGbits 如何简化数据摄取、向量存储管理和聊天机器人部署等复杂任务，使开发者能够高效地创建强大的 AI 解决方案。探索其功能，包括类型安全的 LLM 调用、广泛的格式支持和内置测试工具，从而让您的生成式 AI 项目事半功倍。

阅读更多原文

类别

标记为: RAG

终极 LLM 学习指南：70+ 份 PDF 从基础到进阶

PageIndex：开源的基于推理的 RAG 框架

FlashRAG：高效 RAG 研究的 Python 工具包

rag‑chunk: CLI 工具，用于基准测试和优化 RAG 分块

DeepTutor：AI 驱动的个性化学习助手开源项目

RAG-Anything：一体化多模态RAG框架

掌握高级RAG技巧：GitHub代码库

Langroid：Python 多智能体 LLM 框架

RAGbits：加速GenAI应用开发