Anthropic意外“开源”Agent Infra工具书:对创业者的启示远超伤害

日期:2026-04-02 13:56:05 / 人气:11



2026年3月30日,Anthropic的工程师在发布npm包时,因一个疏忽未在.npmignore中排除source map文件,导致57MB的cli.js.map指向R2存储桶——包含51.2万行TypeScript源代码、1906个未经混淆的源文件,在数小时内被镜像至GitHub,被fork数万次后永久扩散。这并非Anthropic官方主动开源,却达到了等同开源的效果,也成为其在工程能力上与外界最信息对称的一次。对Anthropic而言,此次泄露的伤害微乎其微,但对Agent Infra赛道的创业者来说,这份意外曝光的代码库,无异于一份珍贵的创业工具书、一份行业指导白皮书,清晰勾勒出行业边界与创业机遇。

一、意外泄露:不是复刻指南,而是清醒剂

事件初期,许多喜欢动手、急于入局AI赛道的开发者摩拳擦掌,试图借助泄露的代码复刻一个Claude Code,甚至认为这只是“模型+提示词+工具调用”的轻量级包装,创业公司花几个月就能搭建出MVP。但深入研究后,多数开发者陷入清醒——此次泄露的代码,根本不是Claude的CLI工具,而是Anthropic的Agent操作系统底座,Claude Code本身就是这个底座,只是以产品化形式对外公开,其核心逻辑是“AI Coding as an Infrastructure”,与绝大多数创业公司、甚至大厂的AI编程赛道逻辑截然不同。

这份泄露的代码,本质上是一剂清醒剂,让外界真正看清了Claude Code的真实重量——它并非简单的工具组合,而是经过四年工程迭代的生产级系统工程,其中三个核心工程细节,更彰显了Anthropic的工程壁垒:

(一)四层上下文压缩:破解长任务核心痛点

核心查询循环query.ts是一个800多行的状态机,可处理7种消息类型,其中四层上下文压缩机制尤为关键。它采用递进式逻辑,优先保持信息粒度,仅在必要时牺牲细节,而非简单截断长对话——这一细节,恰恰是当前许多国产模型、Agent仍存在的疏漏。这也印证了Anthropic的核心押注:Agent需支持连续工作数小时甚至数天,上下文管理就是其命门,而这一工程深度,绝非短期复刻可实现。

(二)流式工具并行执行:提升多任务吞吐量

与多数Agent“模型生成→工具调用”的排队模式不同,Claude Code实现了模型生成与工具调用的真正并行,其核心优化目标并非缩短单一任务的响应速度,而是提升Agent同时处理多个任务的吞吐量,这背后是对Agent实用场景的深刻理解——未来Agent需承担多线程工作,并行执行能力是核心竞争力。

(三)多模式运行与递归计费:平台级复杂度的体现

代码中包含交互式、嵌入式、持久后台三种运行模式,且嵌套调用有独立的成本追踪,计费精细到子调用级别。这种设计绝非单一工具可实现,而是平台级的复杂度体现,也反映出Anthropic商业模式的精准度——从运行模式到成本控制,都围绕规模化、商业化落地展开,而非单纯的技术展示。

此前,Anthropic一直对外传递“Harness是最薄的包装”这一理念,不少创业者因此低估了其工程壁垒。此次代码泄露打破了这种认知:数万行代码、数百个工程决策、复杂的状态机管理、完整的容错与恢复基础设施,都证明生产级的Harness是Agent Infrastructure,而非简单的工具组合。低估这一点,试图与Anthropic正面竞争,无异于以卵击石。

二、两大战略信号:Anthropic的未来方向,创业者的时间窗口

泄露的代码中,散落着17个Feature Flag(实验性功能开关),其中大部分是优先级不高的产品探索,如BUDDY(电子宠物)、VOICE_MODE(语音交互)等,但有两个信号尤为关键,既揭示了Anthropic的战略布局,也为创业者指明了时间窗口。

(一)KAIROS:持久后台代理,定义Agent终局形态

KAIROS是藏在隐藏模式中的持久后台代理,已部分实现。这一功能传递出一个清晰的信号:Anthropic认为,Agent的终局形态并非“人指令、AI执行”的交互工具,而是能在后台自主运行的基础设施——无论用户是否在场,Agent都能持续完成任务。这一战略方向,决定了其Harness的设计核心:状态持久化、任务恢复、长时间运行的资源管理,全都是为“无人值守”场景准备的。

(二)PROACTIVE:主动式AI,翻转交互范式

PROACTIVE(主动式AI)仍处于实验阶段,它彻底颠覆了传统Agent的“Manus模式”(人下指令、AI执行),转而实现“AI主动发起行动、人负责审批”的交互范式。如果说KAIROS定义了Agent“在哪里跑”,那么PROACTIVE就定义了Agent“谁说了算”,两者叠加,勾勒出一幅未来Agent的清晰图景:无需用户指令,自主决策、后台持续执行,用户仅需偶尔审批即可。

对创业者而言,这是一个宝贵的时间窗口。Anthropic虽明确了这一战略方向,但尚未推出成型产品,在其正式发力前,创业公司若能在零售、保险、财务等垂直领域,率先落地符合这一范式的产品,有望建立先发优势。但需注意,这个窗口以月为单位计算,留给创业者的时间并不多。

三、边界之外:Agent Infra创业者的四大机会

这份泄露代码的最大价值,并非展示Anthropic的强大——这一点早已被行业公认,而是首次让外界看清其工程疆域:哪些是已筑好壁垒的核心领域,哪些是尚未涉足的“荒野”。对创业者而言,放弃正面竞争,聚焦Anthropic未覆盖的领域,才是破局关键。

(一)训练环境:确定性最高的赛道

泄露代码中,taskBudget与maxTurns仅为任务限制系统的雏形,缺乏完善的沙箱和专业的rollout基础设施。Anthropic之所以不深耕这一领域,核心原因在于其利益重心在模型层,环境层并非优先级——就像英伟达不会自己建设数据中心一样。但当前Agentic RL的最大瓶颈,恰恰不是算法,而是环境质量,专业RL沙箱、代码执行环境、浏览器模拟器等基础设施,仍停留在手工作坊阶段,供需错配极为突出,这正是创业者的核心机会。

(二)垂直行业技能:通用底座之上的核心壁垒

Claude Code的commands.ts提供了通用的技能加载框架,但框架与行业知识是完全不同的两层工程。Harvey(法律Agent)、Abridge(医疗Agent)的核心壁垒,并非工具调用能力,而是对垂直行业工作流的深度理解——法律文书的引用格式、医疗记录的合规要求、金融模型的风控逻辑,这些专业知识无法通过通用框架解决。Anthropic的工程师擅长搭建状态机,却缺乏垂直行业的专业积累,这种组织能力的不匹配,为创业者留下了巨大空间。未来,垂直领域的Agent创业,核心是将行业专业知识Skills化,既可以打造独立Agent公司,也可以将行业数据层“打包”成Skills,适配各类Agent。

(三)独立评估:高客单价的刚需赛道

泄露代码中虽有logEvent功能,可记录Agent每一步操作(工具调用、token消耗、执行结果等),但这种自我记录无法满足合规需求——银行不会信任被审计方自己的工具做合规检查,医院也不会让AI自我评估诊断质量。第三方行为审计、跨模型成本归因、合规检查引擎,这类产品的价值不在于技术难度,而在于独立性和垂直领域专业性。Agent越自主,对“独立缰绳”的需求就越强烈,而这种缰绳必须由第三方打造,其商业模式天然指向大客户、高客单价,适合独立上市,而非被收购(收购会丧失核心的独立性)。

(四)中国本土Harness生态:特色化的独立赛道

这是一个极具中国特色的创业方向。Anthropic的工程架构与中国AI生态脱节,国内Agent创业公司与字节跳动、阿里巴巴的差距,远小于硅谷创业公司与Anthropic的差距,这意味着无论Anthropic做过与否,国内创业者都有机会。但需明确:“复制中国版Claude Code”毫无意义,中国企业的工具链(飞书文档、钉钉审批、企微客户管理)与美国SaaS生态,在数据结构和工作流上完全不同,需重新设计工具定义层,适配本土工具和商业模式。近期飞书、钉钉开放CLI给生态,也为这一方向提供了重要启发——在豆包、Qwen、Kimi等本土模型之上,构建集成中国原生工具链的Harness层,是一个独立的生态工程,Anthropic无法覆盖,也无模板可抄。

此次Anthropic的代码泄露,堪称行业的一次“意外福利”:它让创业者第一次无需猜测、无需推演,就能清晰看到Agent操作系统底座的实际边界。但看清边界只是第一步,在边界之外搭建出有价值的产品,才是创业成功的关键。对Anthropic而言,此次泄露未触及核心利益,伤害甚微;但对Agent Infra赛道的创业者而言,这份意外“开源”的工具书,带来的启发与机遇,远超想象——天底下竟还有这样“双赢”的意外。

作者:盛煌娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 盛煌娱乐 版权所有