绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
0
0
暴涨47.3k Stars!字节开源Harness项目DeerFlow 2.0,让智能体几乎能完成任何复杂任务
分类: AI开源项目
2026-03-26 17:36:00

智猩猩AI整理

编辑:没方

回顾过去三年,AI 工程的焦点经历了两次剧烈跃迁:

2023-2024年,我们痴迷于提示工程(Prompt Engineering),绞尽脑汁教人类怎么跟AI说话;

2025年,重心转向上下文工程(Context Engineering),我们开始精算给AI看什么信息;

而站在2026年的今天,当大模型的能力趋于同质化,真正决定智能体能否落地、能否稳定干重活,不再是模型本身,而是Harness。

Harness直译就是马具,而 AI Agent 就是那匹强壮却野性难驯的骏马。Harness 不提供动力,却能牢牢牵住方向、稳住步伐,让这匹烈马既能全力奔驰,又始终走在正确的路上。

前Hugging Face 工程师Philipp Schmid 在博客《The importance of Agent Harness in 2026》中给出定义:Agent Harness 是包裹在 AI 模型周围的基础设施,专门用于管理长期任务。它并不是 Agent 本身,而是位于 Agent Framework 之上的更高层架构。它提供了预设 Prompt、工具调用的标准化处理、生命周期钩子,以及开箱即用的能力,例如规划、文件系统访问、子智能体管理等。

为此,今天要给大家介绍一个字节跳动的开源项目DeerFlow 2.0,将第一代的Deep Research直接升级成Super Agent Harness。通过将 sub-agents、memory 和 sandbox 有机组织在一起,再配合可扩展的 skills,让 Agent 几乎能完成任何复杂任务。该项目刚发布时便登顶 GitHub Trending 第一,目前 Stars 已突破 47.3k。

  • 项目链接:https://github.com/bytedance/deer-flow/tree/main

01 项目介绍

DeerFlow的全称是Deep Exploration and Efficient Research Flow,最初只是一个Deep Research框架。但在实际使用过程中,社区逐渐将它拓展到了更多场景——从数据流水线搭建、PPT 生成,到 dashboard 构建与内容自动化生产,玩法不断延展。

于是字节团队干脆从头重构,推出了DeerFlow 2.0。

DeerFlow 2.0是一个开箱即用、具备高度扩展能力的super agent harness。它基于 LangGraph 和 LangChain 构建,借助沙盒环境、长期记忆、工具集、技能模块、子智能体以及消息网关,它可以处理从几分钟到几小时的不同复杂度任务。

DeerFlow 2.0的核心能力主要可以拆成以下几个部分:

(1)Skills 与 Tools

DeerFlow 内置研究、报告生成、幻灯片制作、网页生成、图文视频创作等skills。可以一键添加、替换、组合skills,还支持按需渐进加载,不浪费token。Tools同样可插拔,网页搜索、抓取、文件操作、Bash执行一应俱全,还能通过MCP Server或Python函数无限扩展。

(2)Sub-Agents(子智能体)

复杂任务DeerFlow会进行自动拆解,主智能体可以按需动态拉起子智能体,每个子智能体拥有独立上下文、工具和终止条件,可并行执行,最后由主智能体汇总结果。这也是 DeerFlow 能处理从几分钟到几小时任务的原因。

(3)Sandbox 与文件系统——给Agent一台“电脑”

每个任务都在隔离的Docker容器里运行,拥有完整的文件系统,包括 skills、workspace、uploads、outputs。agent 可以读写和编辑文件,可以执行 bash 命令和代码,也可以查看图片。整个过程都在 sandbox 内完成,可审计、会隔离,不同 session 之间不会互相污染。

(4)Context Engineering

子智能体的上下文完全隔离,避免干扰。并且DeerFlow 能够自动总结、压缩、持久化中间结果,超长任务不爆上下文,稳定跑完复杂流程。

(5)长期记忆

DeerFlow能够跨会话积累个人偏好、写作风格、技术栈,memory 保存在本地,控制权也始终在用户手里。

此外,它还支持Claude Code直接交互、内嵌Python Client、多模型兼容,并集成了智能搜索抓取工具InfoQuest。

02 使用方法

(1)克隆 DeerFlow 仓库

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

(2)生成本地配置文件

在项目根目录(deer-flow/)执行:

make config

这个命令会基于示例模板生成本地配置文件。

(3)配置要使用的模型

编辑config.yaml,至少定义一个模型:

models:
  - name: gpt-4                       # 内部标识
    display_name: GPT-4                  # 展示名称
    use: langchain_openai:ChatOpenAI           # LangChain 类路径
    model: gpt-4                     # API 使用的模型标识
    api_key: $OPENAI_API_KEY             # API key(推荐使用环境变量)
    max_tokens: 4096                  # 单次请求最大 tokens
    temperature: 0.7                  # 采样温度

  - name: openrouter-gemini-2.5-flash
    display_name: Gemini 2.5 Flash (OpenRouter)
    use: langchain_openai:ChatOpenAI
    model: google/gemini-2.5-flash-preview
    api_key: $OPENAI_API_KEY             # 这里 OpenRouter 依然沿用 OpenAI 兼容字段名
    base_url: https://openrouter.ai/api/v1

(4)为已配置的模型设置 API key

编辑项目根目录下的 .env 文件。

TAVILY_API_KEY=your-tavily-api-key
OPENAI_API_KEY=your-openai-api-key
# 如果配置使用的是 langchain_openai:ChatOpenAI + base_url,OpenRouter 也会读取 OPENAI_API_KEY
# 其他 provider 的 key 按需补充
INFOQUEST_API_KEY=your-infoquest-api-key

(5)运行应用

推荐使用Docker。

  • 开发模式(支持热更新,挂载源码):

make docker-init    # 拉取 sandbox 镜像(首次运行或镜像更新时执行)
make docker-start    # 启动服务(会根据 config.yaml 自动判断 sandbox 模式)
  • 生产模式(本地构建镜像,并挂载运行期配置与数据):

make up     # 构建镜像并启动全部生产服务
make down     # 停止并移除容器

访问地址:http://localhost:2026

(6)Claude Code 集成

借助claude-to-deerflow技能,可以直接在Claude Code里和正在运行的 DeerFlow实例交互。不用离开终端,就能下发研究任务、查看状态、管理 threads。

安装这个 skill:
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

然后确认DeerFlow已经启动,在 Claude Code 里使用/claude-to-deerflow命令即可。

完整步骤请参考:

https://github.com/bytedance/deer-flow/blob/main/README_zh.md#%E5%BF%AB%E9%80%9F%E5%BC%80%E5%A7%8B

03 Harness 崛起:AI 从“能聊”走向“能干”

过去的竞争,比的是谁的模型参数更多、谁的单点能力更惊艳。

而未来的分水岭,很可能取决于谁能打造出更成熟、更强大的 Harness 体系 ——谁能让 AI Agent 在真实业务场景中稳定、可靠地连续运行;谁能在隔离与开放、灵活与安全之间,找到工程上的最优平衡。

从提示工程到上下文工程,再到如今的 Harness,这条演进路径的本质是从“教模型如何理解人类”迈向“为模型构建一个可执行、可信赖、可长期运转的数字世界”。

当越来越多像 DeerFlow 2.0 这样的 Super Agent Harness 走向普及,AI 将真正进化为能理解、会规划、可执行、敢交付、长期负责的成熟生产力形态。