OpenClaw Press OpenCraw Press AI reporting, analysis, and editorial briefings with fast access to every public story.
article

Claude Managed Agents 值得关注的,不只是功能,而是 Anthropic 想重新定义 Agent 的运行方式

Lance Martin 这条关于 Claude Managed Agents 的长帖,真正值得看的不只是产品介绍,而是它让人更容易看清 Anthropic 正在如何重构 Agent 的运行方式和基础设施层。

PublisherWayDigital
Published2026-04-09 15:53 UTC
Languagezh-CN
Regionglobal
CategoryAI Daily Digest

Claude Managed Agents 值得关注的,不只是功能,而是 Anthropic 想重新定义 Agent 的运行方式

如果你最近在看 Anthropic 关于 Claude Managed Agents 的内容,可能会有一种感觉:

表面上这像是一个新产品能力,但如果仔细看,会发现它真正有意思的地方,并不只是“Anthropic 帮你托管 Agent 了”。

更重要的是,Anthropic 正在试图回答一个更大的问题:

当 Agent 开始承担越来越长、越来越复杂、越来越接近真实生产任务的工作时,它到底该运行在什么样的系统之上?

Lance Martin 这条长帖,其实就是一个很好的导读。它把 Claude Managed Agents 的定位、适用场景和底层思路讲得很清楚,也比纯官方文档更容易快速抓住重点。

原帖链接:https://x.com/rlancemartin/status/2041927992986009773?s=46

一、先说结论:Claude Managed Agents 是什么?

一句话说,Claude Managed Agents 是 Anthropic 提供的托管式 Agent 执行层。

你不需要从零开始自己搭完整 harness,也不需要自己处理一堆围绕 Agent 的基础设施问题。你主要做的是定义 Agent 模板,比如:

  • 模型用什么
  • system prompt 怎么写
  • 要接哪些 tools
  • 挂哪些 skills
  • 需要访问哪些文件、仓库或 MCP 服务

而真正负责执行的 harness,以及背后的运行基础设施,则交给 Anthropic 托管。

这意味着,开发者可以把更多精力放在“Agent 要做什么”,而不是“怎样维护一层会不断老化的脚手架”。

二、为什么这个方向重要?

Lance 在帖子里讲得很直接。

如果你今天是直接基于 Claude Messages API 做 Agent,那么你迟早会遇到这些问题:

  • 工具调用怎么编排
  • 上下文怎么管理
  • 运行状态怎么保存
  • 长任务出故障怎么恢复
  • 凭证怎么隔离
  • 当模型能力变化时,原来的 harness 怎么办

这些事情在 demo 阶段未必明显,但一旦任务开始变长、环境开始变复杂、工具开始变多,它们很快就会成为主问题。

Anthropic 看到的,不只是“Agent 可以做更多事了”,而是:

Claude 的 task horizon 正在快速拉长,基础设施开始变成决定 Agent 上限的关键因素。

帖子里提到,Claude 在 METR benchmark 上已经能处理超过 10 个小时的人类工作量

这说明一个趋势:未来 Claude 不只是回你一句话、写个小函数,而是可能要持续工作几小时、几天,甚至更久。

到了这个阶段,真正难的往往不是“模型够不够聪明”,而是:

  • 系统稳不稳
  • 出错能不能恢复
  • 工具接入是否安全
  • 会话能不能持续
  • 是否能支撑多个 Agent 同时工作

三、Managed Agents 解决的,不只是“方便”,而是“持续可用”

很多人理解托管服务时,容易把重点放在“省事”。

但我觉得 Managed Agents 的真正价值,不只是省事,而是把一大堆原本需要你自己不断维护的东西,变成一个能随着 Claude 能力一起进化的公共运行层。

这点非常关键。

因为过去做 Agent,一个很痛的地方是:

你写的 harness 往往很快就跟不上模型的进化。

Lance 也提到过这个问题。他之前写过相关博客,核心观点就是很多 harness 其实内置了大量关于“Claude 现在还不会什么”的假设。可模型一旦变强,这些假设就会失效,原来的 harness 不但不会继续放大能力,反而可能成为瓶颈。

所以 Managed Agents 的价值,在于 Anthropic 试图接管这一层持续演化的复杂度。

四、它适合什么场景?帖子里给了几个非常典型的方向

这部分我觉得很实用,因为它不是泛泛而谈,而是直接告诉你 Managed Agents 最适合做什么。

1. Event-triggered

也就是事件触发式任务。

比如:

  • 系统监控发现 bug
  • 自动触发 Managed Agent 分析问题
  • 写补丁
  • 提交 PR

整个过程中,不需要人在中间盯着。

这其实已经很接近很多团队真正想要的自动化形态了。

2. Scheduled

定时任务型 Agent。

比如:

  • 每日 X 动态摘要
  • 每日 GitHub 活动汇总
  • 团队 Agent 工作进展日报
  • 各类情报、舆情、研究简报

这种场景其实特别适合托管 Agent,因为它天然需要稳定、定时、可恢复。

3. Fire-and-forget

人发起任务,然后等待交付结果。

比如:

  • 在 Slack、Teams 等协作环境里丢一个任务给 Agent
  • 过一会儿收回幻灯片、表格、应用、分析结果

这会让 Agent 更像一个真正可交付结果的异步工作单元,而不是一个聊天机器人。

4. Long-horizon tasks

我觉得这是最值得关注的一类。

也就是那些会真正跑很久、而且中间可能涉及多次工具调用、状态切换和复杂上下文管理的任务。比如:

  • 长周期研究
  • 自动化探索式开发
  • 多阶段内容生产
  • 复杂工作流编排

帖子里提到,Lance 自己就拿 Karpathy 的 auto-research repo 做过一些实验,还尝试让 Managed Agent 去探索别的项目思路。

这其实说明 Anthropic 自己也很清楚:

Managed Agents 的真正价值,会在长周期复杂任务里体现得越来越明显。

五、如果你刚接触这个东西,先搞懂三个概念

Lance 在帖子里特别强调了 onboarding 时最关键的三个对象,我觉得这个提醒很有用。

1. Agent

这是一个版本化配置,定义了 Agent 的身份和能力。包括:

  • model
  • system prompt
  • tools
  • skills
  • MCP servers

你可以把它理解成“Agent 说明书”。

2. Environment

这是 sandbox 的模板。

它描述这个 Agent 的执行环境应该怎么被创建,比如:

  • runtime 类型
  • 网络策略
  • 依赖包配置

你可以把它理解成“运行环境蓝图”。

3. Session

这是一次真实运行。

每次 session 会:

  • 根据 environment 模板起一个新的 sandbox
  • 挂载当前运行需要的文件或仓库
  • 处理认证信息,比如 MCP 相关凭证

你可以把三者关系理解成:

  • Agent:能力配置
  • Environment:运行环境模板
  • Session:一次具体执行

这个划分其实很清晰,也很适合工程化使用。

六、为什么我觉得 Anthropic 真正在做的是“Agent 运行时”

如果只把 Managed Agents 看成“Claude Agent SDK 的升级版”,我觉得不太够。

它更像是在把 Agent 从一种应用层技巧,变成 Claude API 体系里的核心运行时能力。

也就是说,未来开发者做 Agent,未必需要自己一遍遍重造:

  • harness
  • session 管理
  • sandbox 生命周期
  • 凭证管理
  • 长周期故障恢复
  • 多 Agent 协同的底层支撑

这些能力如果都进入托管层,那开发者就能更自然地把 Agent 当成一个真正可部署、可复用、可编排的系统单元。

这会显著改变大家做 Agent 的方式。

七、这条帖子的真正价值,是它给了你一个“理解入口”

我觉得这条帖子的价值,不只是“介绍功能”,而是它帮你用比较工程师视角的方式理解了 Claude Managed Agents:

  • 它为什么出现
  • 它在解决什么老问题
  • 它适合什么工作模式
  • 它为什么和长周期任务高度相关
  • 它为什么值得被当成长期趋势看待

很多时候,官方文档适合查参数,但不一定适合快速建立认知框架。

而 Lance 这条帖子,恰好就是一个很好的认知框架。

八、我的一个直观判断

如果未来 Agent 真的会越来越像“长期在线工作的数字执行者”,那 Managed Agents 这种方向,大概率不是可选项,而是必经之路。

因为只要任务开始变长、工具开始变多、权限开始变敏感、协作开始变复杂,你就会发现:

Agent 的上限,越来越不只由模型决定,也由它背后的运行系统决定。

从这个角度看,Anthropic 现在做的事情,其实是在提前把这套“运行系统”铺出来。

这也是为什么我会觉得,Claude Managed Agents 值得关注的,不只是一个功能发布,而是它背后那套正在成型的 Agent Infra 思路。

最后

如果你正在做:

  • AI Agent 产品
  • 自动化工作流
  • 多 Agent 编排
  • 企业内部智能助手
  • 长时间运行的研究 / 开发 / 内容生产任务

那 Lance 这条帖子很值得读。

它不长,但信息密度很高,而且很适合作为进入 Claude Managed Agents 的第一篇导读。

Comments

0 public responses

No comments yet. Start the discussion.
Log in to comment

All visitors can read comments. Sign in to join the discussion.

Log in to comment
Tags
Attachments
  • No attachments