智猩猩AI整理
编辑:汐汐
现如今,尽管大模型具备强大的能力,但是在构建状态持久化、多工具和多API调用等复杂的智能体的时候,开发者往往深陷于底层工程的泥潭。
因为缺乏高效的任务编排引擎,开发者常常需要投入大量精力在非业务核心上,大幅拉低了研发效能。
北京时间4月9日,Anthropic正式宣布Claude Managed Agents,向开发者开放了一个专为生产性能调优的Agent Harness,目前已经在Claude平台上进入公测阶段。
借助这个内置的编排Harness,开发者得以告别繁重的并发管理、状态追踪和错误恢复工作,让大模型真正成为可靠的中央大脑。

01 Claude Managed Agents:作为中心大脑的Harness
4月9日,Claude官方发布帖子,推出一项名叫Claude Managed Agents的功能。

传统的AI智能体在实际的生产环境中一直面临着AI Infra的挑战。
Anthropic官方在博客中明确指出,“开发者若要将大模型真正落地为可靠的生产级Agent,必须自行解决一系列复杂工程难题”。
这些工程难题包括状态管理、权限控制、安全沙箱执行、多任务并行协调、错误恢复等等,例如长时会话下的持久化和断线恢复、凭证密钥、代码工具调用的隔离环境、并发调度和资源控制等多种方面。
而这些工作实际上与开发者面临的核心业务并没有什么关系,但是却会占用更多更长的时间。这直接导致不少团队卡在了一个“原型跑得动、生产跑不稳”的尴尬状态。

在这个官方给出的架构图中可以看到,中间的Harness作为中枢编排引擎,管理着如下方面:
工具与资源。这意味着开发者只需要声明工具即可,而Harness负责调用。
持久化会话。长达数小时甚至数天运行的长时异步任务,这是传统智能体非常令人头疼的状态管理地狱。
安全沙箱执行。确保密钥永不进入、结果通过Harness返回,来做到真正的脑手分离。
编排层。动态创建子智能体并行协作等。
官方将其定义为“a built-in orchestration harness that decides when to call tools, how to manage context, and how to recover from errors”。

Managed Agents将“基础设施层”全部托管到Anthropic的生产级云平台,开发者只需定义Agent的任务、工具和防护工具,就能直接获得开箱即用的生产级运行环境。
作为一个深度调优的中枢引擎,它智能化地决定了工具调用、管理上下文窗口、错误恢复和重试等逻辑,并且保证智能体在高强度的并发和长时间的运行场景下具备稳定性。
通俗来讲,在过去,开发者必须手动搭建智能体的各个模块,现在成为了平台的原生能力。
官方博客介绍其强大的工作能力,内容翻译:“迄今为止,构建智能体需要在开发周期中投入资源用于安全infra、状态管理、权限控制以及为每次模型升级重新设计智能体循环。Managed Agents将针对性能优化的智能体框架与生产级infra相结合,使从原型到发布的流程从数月缩短至数天。”,同时博客标题直言速度快10倍。

目前已经有一些早期内部用户参与,包括Notion、Asana、Rakuten、Sentry、Vibecode等公司。
02 Anthropic从底层开始接管:智能体编排初创公司面临淘汰
当技术讨论回归本质,开发者和用户真正始终关心的还是对实际上手后的效率提升以及是否稳定、Anthropic提供的这个方案是否真正解决了智能体开发中的问题才是关键。许多独立开发者开发者、和行业内的大V都纷纷热议。
例如知名AI分析师和创业者Aakash Gupta直言道,“该发布直接大规模淘汰了该领域的所有初创公司”。Manus用了半年重构5个harness、LangChain用了一年开发了4个架构,而Anthropic发布的这个直接完全消除了再构建一个的必要性。

devv.ai创始人兼CEO、前TikTok_US的高管Jiayuan Zhang发布Github链接称他们开发了Claude Managed Agents的开源版本。不过具体好不好用、效果如何,还有待验证。

开发者Akshay称,该功能最大的胜利就在于解放了开发者,能让开发者专注于架构,而不是一些其他的琐事。

AI智能体构建者Michael分析认为,该发布对Anthropic来说是一个巨大的转变,其野心完全不只是作为一个模型提供商,它还想提供从下到上的多个层面。

还有账号分析称,“OpenAI和Google以及Anthropic的策略完全不同,前二者一个轻量级、一个面向企业,而Anthropic选择了从底层开始全部接管”,并提出了关于易用性与生态方面的担忧。

03 AI智能体走向规模化:需要足够牢靠的Infra地基
Claude Managed Agents彻底把过去开发者需要搭建的一些Agent Infra等全部都商品化,开发者只需要把这些交给Anthropic统一托管即可,不再需要一点点调试、一点点构建。这也就意味着,对精力有限的独立开发者来说大模型的潜力不再被底层的工程瓶颈拖累。
然而当开发者深度依赖Anthropic的Claude Managed Agents这一Harness后,未来如果想要迁移,则成本可能会远高于自建方案。另外,Harness内部的决策逻辑仍然是平台侧的黑箱,因此在风险控制方面仍然需要打一个问号。
即便如此,Claude Managed Agents在智能体行业中绝不仅仅只是一个普通的新功能更新,甚至可以说是AI智能体规模化阶段中,Infra层次上的突破。AI厂商的身份从模型提供商开始转向综合服务提供商,整个行业的转型也在加速变化。
现如今,大模型的能力已经足够强大,对所有用户、开发者和企业来说,如果使用模型的基础设施建设并落地、地基打得足够牢靠扎实,那么上面构筑的AI摩天大楼才会更加宏伟。