标记为: LLM

Content related to LLM

FlashRAG:高效 RAG 研究的 Python 工具包

January 16, 2026

FlashRAG 是一款前沿、MIT 许可的 Python 框架,将检索增强生成(RAG)研究从理论转化为实践。凭借 36 个预处理好的基准数据集、23 个前沿算法和轻量级 UI,研究人员可以在几分钟内原型并评估 RAG pipeline。无论您是构建自定义检索堆栈的数据科学家、探索基于推理方法的 LLM 开发者,还是想获得即时结果的业余爱好者,FlashRAG 的模块化设计、易于安装和丰富组件都使复杂的 RAG 工作变得可接近。了解如何设置环境、配置 pipeline,并利用工具包的推理方法进行多跳问答,同时为活跃的开源 RAG 爱好者社区贡献力量。

Claude 代码设置终极指南:钩子、技能与动作

January 16, 2026

了解如何利用 Claude Code 将您的代码仓库变成一个智能的 AI 助手。本教程将带您一步步创建 .claude 文件夹、配置钩子与代理、搭建针对 JIRA 与 GitHub 的 MCP 服务器、启用 LSP 实现实时代码洞察、以及通过 GitHub Actions 连接自动化质量检查和定期维护。配备代码片段、目录布局和最佳实践技巧,您将学会构建可复用的技能、斜线命令和自动化评审流程。准备好提升生产力、统一代码规范吗?继续阅读,获取完整实操指南。

Skyvern AI:利用大语言模型和视觉技术自动化浏览器工作流

November 12, 2025

探索 Skyvern,这是一个创新的开源项目,它利用大型语言模型(LLM)和计算机视觉技术彻底改变了浏览器自动化。与传统方法不同,Skyvern 能够适应网站变化,使自动化更加稳定和高效。了解它是如何简化诸如表格填写、数据提取,甚至各种网站上的复杂工作流程等任务的,从而改变企业和个人处理基于网络的运营方式。通过快速安装即可开始使用,并探索其强大功能,适用于从发票下载到职位申请等广泛应用。

微软智能代理框架 Lightning:零代码实现 AI 智能代理训练

November 04, 2025

探索 Agent Lightning,这是微软推出的一款创新开源框架,旨在为您的 AI 智能体注入超强动力。无论底层框架如何,该平台都能以最少的代码改动来优化您的任何 AI 智能体。Agent Lightning 利用强化学习和自动提示优化等先进算法,赋能开发者和研究人员提升智能体性能,将其打造成“可优化的野兽”。探索其核心功能,了解其架构,并学习如何将这个强大的训练器集成到您的项目中,从而加速 AI 智能体开发并取得卓越成果。

自己动手打造你的专属ChatGPT:Nanochat—百元级LLM

October 21, 2025

探索Andre_j Karpathy的开源项目Nanochat,这是一个ChatGPT类大型语言模型的全栈实现。了解如何在预算有限的情况下训练、微调并运行您自己的大型语言模型,计算成本低至100美元。这个精简、易于修改的代码库旨在提高可访问性,让爱好者能够从零开始体验大型语言模型开发。深入微模型的世界,了解从词元化到网络服务的所有过程,所有这些都包含在一个统一的项目中。通过实用的脚本亲身体验,深入了解训练您自己的人工智能助手的成本和复杂性。

Nanobrowser:AI 网页自动化 Chrome 扩展

October 15, 2025

探索 Nanobrowser,这是一款开源的 Chrome 扩展程序,它正在彻底改变由 AI 驱动的网页自动化。作为 OpenAI Operator 的免费替代品,它提供多智能体系统、灵活的大语言模型选项和全面的隐私保护。 使用您自己的 API 密钥,直接在浏览器中运行复杂的自动化流程,零订阅费用,并且完全掌控您的数据。了解如何安装、配置和利用 Nanobrowser 来完成新闻摘要、GitHub 研究和购物自动化等任务。

RAG-Anything:一体化多模态RAG框架

September 26, 2025

探索 RAG-Anything,这是一个创新的开源框架,它通过全面支持多模态文档,彻底改变了检索增强生成(RAG)技术。这个尖端系统能够无缝处理文本、图像、表格和公式,从而克服了传统RAG的局限性。了解 RAG-Anything 如何在 LightRAG 的基础上,提供文档摄取、分析和智能查询的端到端管线,使其成为学术研究、技术文档和企业知识管理的不可或缺的工具。

通义千问DeepResearch:阿里巴巴的开源AI智能体

September 19, 2025

探索由阿里巴巴推出的开创性开源AI智能体——通义深思。该模型拥有305亿参数,并且每token仅激活33亿参数,效率极高,在长时程、深层信息检索任务中表现出色。通义深思在Humanity's Last Exam和BrowserComp等一系列智能体搜索基准测试中均取得了业界领先的性能,其能力建立在WebAgent项目的技术之上。了解其核心功能,包括自动合成数据生成、在智能体数据上持续预训练,以及强大的强化学习技术。学习如何配置和运行该模型,为您的深层研究需求提供支持,充分利用其与ReAct和Heavy推理范式的兼容性。

一周内打造你自己的大语言模型服务器

September 12, 2025

探索大型语言模型(LLM)的世界,尽在 Tiny LLM。这是一门专为系统工程师设计的实践性开源课程。您将学习如何利用 Apple Silicon 上的 MLX 从零开始构建和优化 LLM 服务基础架构。为期一周的学习之旅将涵盖从基础矩阵运算到高级 C++/Metal 内核以及高吞吐量请求批处理等所有内容。无论您是想深入了解 LLM 内部机制,还是希望部署自己的 LLM,Tiny LLM 都将提供清晰的指导和社区支持,助您轻松掌握 LLM 服务。

Koog: 适用于 AI 代理的 Kotlin 框架

September 04, 2025

探索 Koog,一个用于构建强大、可扩展且已准备好投入生产环境的 AI 代理的官方 Kotlin 框架。这个开源项目赋能开发者跨越各种平台(包括后端服务、Android、iOS、JVM 和 Web 浏览器)创建 AI 代理。Koog 凭借 JetBrains 在 AI 领域的专业知识,为复杂的 LLM 挑战提供解决方案,其特色包括纯 Kotlin 实现、MCP 集成、嵌入能力、自定义工具创建以及灵活的图工作流系统。通过其多平台支持和一系列现成组件,了解 Koog 如何简化您的 AI 代理开发。