通义千问DeepResearch:阿里巴巴的开源AI智能体
September 19, 2025
揭秘“通义深搜”:阿里巴巴强大的开源 AI 智能体
阿里巴巴发布了“通义深搜”(Tongyi DeepResearch),这是一款旨在革新深度信息搜集任务的开源 AI 智能体。这款尖端模型拥有高达 305 亿的参数总量,并采用创新方法,每个 token 仅激活 33 亿参数,在不牺牲性能的前提下优化了效率。
“通义深搜”由通义实验室研发,在多项极具挑战性的智能体搜索基准测试中展现出卓越能力,取得了行业领先的成果,包括 Humanity's Last Exam、BrowserComp、BrowserComp-ZH、WebWalkerQA、xbench-DeepSearch、FRAMES 和 SimpleQA。这一宏伟项目建立在阿里巴巴此前 WebAgent 倡议的奠基工作之上,进一步拓展了 AI 在复杂研究场景中的能力边界。
主要特性与创新:
“通义深搜”凭借多项卓越特性脱颖而出:
- 自动化合成数据生成: 采用高度可扩展、全自动化的流水线进行合成数据生成。这为高级智能体预训练、监督微调和强化学习过程提供了支持,确保了模型的鲁棒性和适应性。
- 大规模持续预训练: 模型通过多样化且高质量的智能体交互数据进行大规模持续预训练。这一过程提升了模型的各项能力,保持其知识的时效性,并显著增强了其推理性能。
- 端到端强化学习: 阿里巴巴采用了严格的 On-Policy 强化学习(RL)方法。其中包括定制化的 Group Relative Policy Optimization 框架、Token-level Policy Gradients、Leave-one-out Advantage Estimation 以及负样本的精选过滤,以确保在动态环境中进行稳定的训练。
- 灵活的智能体推理范式: 在推理阶段,“通义深搜”支持两种主要范式:
- ReAct: 非常适合严格评估模型的内在能力。
- 迭代式研究(“重模式”): 采用测试时(test-time)的扩展策略,以释放模型的最大性能潜力。
开始使用“通义深搜”:
该项目为用户提供了清晰的上手指南,包括环境设置、依赖安装和数据准备。代码库提供了配置推理脚本的说明,用户可以指定模型路径、数据集和输出目录。必要的 API 密钥和各种工具的凭证可以在提供的 shell 脚本中进行配置。
模型可用性:
“通义深搜”(Tongyi-DeepResearch-30B-A3B)已在 HuggingFace 和 ModelScope 上开放下载,支持高达 128,000 个 token 的上下文长度。
社区与研究:
该项目还展示了众多相关的研究成果,涵盖了 Web Agents、信息搜集和智能体 RL 等领域的进展。代码库鼓励社区贡献,并积极招募研究实习生。
“通义深搜”代表了开源 AI 在深度研究领域的一大飞跃,为应对复杂信息搜集挑战提供了强大的工具和稳健的框架。
原创文章:
查看原文