在AI领域,大型语言模型(LLM)已经展现出了强大的语言理解和生成能力,但其知识通常是固定的,无法实时更新。尽管检索增强生成(RAG)技术能帮助模型获取最新信息,但传统搜索引擎的横向搜索方式限制了对信息的深度挖掘。为了解决这一问题,阿里和东南大学共同研发了WebWalker,一个多智能体框架,专注于模拟人类的网络浏览和搜索行为,让LLM能够自动点击链接、阅读网页、理解信息,最终给出更精准、更深层次的答案。
一、WebWalker的核心功能
1.1 多智能体协作
WebWalker通过explorer-critic范式模拟人类网页导航,包含两个智能体:
探测代理(explorer agent):模拟人在网页中点击按钮跳转页面的过程。
裁判代理(critic agent):负责存储搜索过程中的信息,在探测代理点击的过程中,保存对查询有用的信息,并判断何时停止探索。
这种多智能体协作模式让WebWalker能够系统性地遍历网页,挖掘隐藏的信息。
1.2 垂直搜索能力
WebWalker能够深入多个网页,系统性地揭露隐藏在其中的信息,找到传统搜索引擎无法揭示的深层次信息。它不仅能够横向搜索,还能纵向挖掘页面内容,提升复杂问题的处理能力。
1.3 RAG二维探索能力
WebWalker结合了横向搜索和纵向页面挖掘,通过多智能体协作实现更智能的信息检索。这种二维探索能力让WebWalker在处理复杂问题时表现出色,能够更精准地定位和提取信息。
二、实验结果
WebWalker在多个基准测试中表现出色,尤其是在处理复杂问题和多跳推理任务时。即使是最先进的模型(如GPT-4O)在WebWalkerQA任务中也表现较差,这表明WebWalker在深度信息挖掘方面具有显著优势。
上篇:
agenticSeek - AI智能体
下篇:
Refly - 开源的AI原生创作引擎
1 OpenAI Agents SDK:轻量级多智能体工作流框架 2 Oliva - 高效的商品检索能力,支持 语音交互 3 ZO2:低显存环境下的 175B LLM 全参数微调解决方案 4 AIaW - 全功能、轻量级、可扩展的AI对话客户端 5 Mastra : 专为 TS 开发者设计的 AI 应用开发框架 6 GraphRAG:基于图像检索增强生成开源到爆火,解锁新RAG技术 7 AI-Researcher:基于 LLM 代理的全自动科学研究平台 8 Local Deep Research - 本地深度 AI 研究助手 9 Sidekick - AI 研究助手:强大的智能研究工具 10 DistillFlow 11 Chipper - 开源智能知识检索和对话增强工具 12 cognita - 低代码 RAG 框架