Anthropic意外“开源”Agent Infra工具书：对创业者的启示远超伤害

日期：2026-04-02 13:56:05 / 人气：51

2026年3月30日，Anthropic的工程师在发布npm包时，因一个疏忽未在.npmignore中排除source map文件，导致57MB的cli.js.map指向R2存储桶——包含51.2万行TypeScript源代码、1906个未经混淆的源文件，在数小时内被镜像至GitHub，被fork数万次后永久扩散。这并非Anthropic官方主动开源，却达到了等同开源的效果，也成为其在工程能力上与外界最信息对称的一次。对Anthropic而言，此次泄露的伤害微乎其微，但对Agent Infra赛道的创业者来说，这份意外曝光的代码库，无异于一份珍贵的创业工具书、一份行业指导白皮书，清晰勾勒出行业边界与创业机遇。

一、意外泄露：不是复刻指南，而是清醒剂

事件初期，许多喜欢动手、急于入局AI赛道的开发者摩拳擦掌，试图借助泄露的代码复刻一个Claude Code，甚至认为这只是“模型+提示词+工具调用”的轻量级包装，创业公司花几个月就能搭建出MVP。但深入研究后，多数开发者陷入清醒——此次泄露的代码，根本不是Claude的CLI工具，而是Anthropic的Agent操作系统底座，Claude Code本身就是这个底座，只是以产品化形式对外公开，其核心逻辑是“AI Coding as an Infrastructure”，与绝大多数创业公司、甚至大厂的AI编程赛道逻辑截然不同。

这份泄露的代码，本质上是一剂清醒剂，让外界真正看清了Claude Code的真实重量——它并非简单的工具组合，而是经过四年工程迭代的生产级系统工程，其中三个核心工程细节，更彰显了Anthropic的工程壁垒：

（一）四层上下文压缩：破解长任务核心痛点

核心查询循环query.ts是一个800多行的状态机，可处理7种消息类型，其中四层上下文压缩机制尤为关键。它采用递进式逻辑，优先保持信息粒度，仅在必要时牺牲细节，而非简单截断长对话——这一细节，恰恰是当前许多国产模型、Agent仍存在的疏漏。这也印证了Anthropic的核心押注：Agent需支持连续工作数小时甚至数天，上下文管理就是其命门，而这一工程深度，绝非短期复刻可实现。

（二）流式工具并行执行：提升多任务吞吐量

与多数Agent“模型生成→工具调用”的排队模式不同，Claude Code实现了模型生成与工具调用的真正并行，其核心优化目标并非缩短单一任务的响应速度，而是提升Agent同时处理多个任务的吞吐量，这背后是对Agent实用场景的深刻理解——未来Agent需承担多线程工作，并行执行能力是核心竞争力。

（三）多模式运行与递归计费：平台级复杂度的体现

代码中包含交互式、嵌入式、持久后台三种运行模式，且嵌套调用有独立的成本追踪，计费精细到子调用级别。这种设计绝非单一工具可实现，而是平台级的复杂度体现，也反映出Anthropic商业模式的精准度——从运行模式到成本控制，都围绕规模化、商业化落地展开，而非单纯的技术展示。

此前，Anthropic一直对外传递“Harness是最薄的包装”这一理念，不少创业者因此低估了其工程壁垒。此次代码泄露打破了这种认知：数万行代码、数百个工程决策、复杂的状态机管理、完整的容错与恢复基础设施，都证明生产级的Harness是Agent Infrastructure，而非简单的工具组合。低估这一点，试图与Anthropic正面竞争，无异于以卵击石。

二、两大战略信号：Anthropic的未来方向，创业者的时间窗口

泄露的代码中，散落着17个Feature Flag（实验性功能开关），其中大部分是优先级不高的产品探索，如BUDDY（电子宠物）、VOICE_MODE（语音交互）等，但有两个信号尤为关键，既揭示了Anthropic的战略布局，也为创业者指明了时间窗口。

（一）KAIROS：持久后台代理，定义Agent终局形态

KAIROS是藏在隐藏模式中的持久后台代理，已部分实现。这一功能传递出一个清晰的信号：Anthropic认为，Agent的终局形态并非“人指令、AI执行”的交互工具，而是能在后台自主运行的基础设施——无论用户是否在场，Agent都能持续完成任务。这一战略方向，决定了其Harness的设计核心：状态持久化、任务恢复、长时间运行的资源管理，全都是为“无人值守”场景准备的。

（二）PROACTIVE：主动式AI，翻转交互范式

PROACTIVE（主动式AI）仍处于实验阶段，它彻底颠覆了传统Agent的“Manus模式”（人下指令、AI执行），转而实现“AI主动发起行动、人负责审批”的交互范式。如果说KAIROS定义了Agent“在哪里跑”，那么PROACTIVE就定义了Agent“谁说了算”，两者叠加，勾勒出一幅未来Agent的清晰图景：无需用户指令，自主决策、后台持续执行，用户仅需偶尔审批即可。

对创业者而言，这是一个宝贵的时间窗口。Anthropic虽明确了这一战略方向，但尚未推出成型产品，在其正式发力前，创业公司若能在零售、保险、财务等垂直领域，率先落地符合这一范式的产品，有望建立先发优势。但需注意，这个窗口以月为单位计算，留给创业者的时间并不多。

三、边界之外：Agent Infra创业者的四大机会

这份泄露代码的最大价值，并非展示Anthropic的强大——这一点早已被行业公认，而是首次让外界看清其工程疆域：哪些是已筑好壁垒的核心领域，哪些是尚未涉足的“荒野”。对创业者而言，放弃正面竞争，聚焦Anthropic未覆盖的领域，才是破局关键。

（一）训练环境：确定性最高的赛道

泄露代码中，taskBudget与maxTurns仅为任务限制系统的雏形，缺乏完善的沙箱和专业的rollout基础设施。Anthropic之所以不深耕这一领域，核心原因在于其利益重心在模型层，环境层并非优先级——就像英伟达不会自己建设数据中心一样。但当前Agentic RL的最大瓶颈，恰恰不是算法，而是环境质量，专业RL沙箱、代码执行环境、浏览器模拟器等基础设施，仍停留在手工作坊阶段，供需错配极为突出，这正是创业者的核心机会。

（二）垂直行业技能：通用底座之上的核心壁垒

Claude Code的commands.ts提供了通用的技能加载框架，但框架与行业知识是完全不同的两层工程。Harvey（法律Agent）、Abridge（医疗Agent）的核心壁垒，并非工具调用能力，而是对垂直行业工作流的深度理解——法律文书的引用格式、医疗记录的合规要求、金融模型的风控逻辑，这些专业知识无法通过通用框架解决。Anthropic的工程师擅长搭建状态机，却缺乏垂直行业的专业积累，这种组织能力的不匹配，为创业者留下了巨大空间。未来，垂直领域的Agent创业，核心是将行业专业知识Skills化，既可以打造独立Agent公司，也可以将行业数据层“打包”成Skills，适配各类Agent。

（三）独立评估：高客单价的刚需赛道

泄露代码中虽有logEvent功能，可记录Agent每一步操作（工具调用、token消耗、执行结果等），但这种自我记录无法满足合规需求——银行不会信任被审计方自己的工具做合规检查，医院也不会让AI自我评估诊断质量。第三方行为审计、跨模型成本归因、合规检查引擎，这类产品的价值不在于技术难度，而在于独立性和垂直领域专业性。Agent越自主，对“独立缰绳”的需求就越强烈，而这种缰绳必须由第三方打造，其商业模式天然指向大客户、高客单价，适合独立上市，而非被收购（收购会丧失核心的独立性）。

（四）中国本土Harness生态：特色化的独立赛道

这是一个极具中国特色的创业方向。Anthropic的工程架构与中国AI生态脱节，国内Agent创业公司与字节跳动、阿里巴巴的差距，远小于硅谷创业公司与Anthropic的差距，这意味着无论Anthropic做过与否，国内创业者都有机会。但需明确：“复制中国版Claude Code”毫无意义，中国企业的工具链（飞书文档、钉钉审批、企微客户管理）与美国SaaS生态，在数据结构和工作流上完全不同，需重新设计工具定义层，适配本土工具和商业模式。近期飞书、钉钉开放CLI给生态，也为这一方向提供了重要启发——在豆包、Qwen、Kimi等本土模型之上，构建集成中国原生工具链的Harness层，是一个独立的生态工程，Anthropic无法覆盖，也无模板可抄。

此次Anthropic的代码泄露，堪称行业的一次“意外福利”：它让创业者第一次无需猜测、无需推演，就能清晰看到Agent操作系统底座的实际边界。但看清边界只是第一步，在边界之外搭建出有价值的产品，才是创业成功的关键。对Anthropic而言，此次泄露未触及核心利益，伤害甚微；但对Agent Infra赛道的创业者而言，这份意外“开源”的工具书，带来的启发与机遇，远超想象——天底下竟还有这样“双赢”的意外。

作者：盛煌娱乐

Anthropic意外“开源”Agent Infra工具书：对创业者的启示远超伤害

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →