首页

快讯深度数据 Skill&API

分析Claude Code源码：为什么它会比其他AI编程工具好用？

阅读本文需 23 分钟

Anthropic 选了最难的那条路，用你的终端、你的环境、你的配置来干活，而不是「在一个干净房间里给你写一段代码然后复制过来」。

原文标题：《一文了解 Anthropic 的 Claude Code 源码：为什么它就是比别人好用？》

原文作者：Yuker，AI 研究员

2026 年 3 月 31 日，安全研究者 Chaofan Shou 发现 Anthropic 发布到 npm 的 Claude Code 包中，source map 文件没有被剥离。

这意味着：Claude Code 的完整 TypeScript 源码，51.2 万行，1903 个文件，就这样暴露在了公网上。

我当然不可能在短短数小时内看完这么多代码，因此，我带着三个问题去读这份源码：

1. Claude Code 和其他 AI 编程工具到底有什么本质区别？

2. 为什么它写代码的「手感」就是比别人好？

3. 51 万行代码里，到底藏着什么？

读完之后，我的第一反应是：这不是一个 AI 编程助手，这是一个操作系统。

一、先讲一个故事：如果你要雇一个远程程序员

想象你雇了一个远程程序员，给他你电脑的远程访问权限。

你会怎么做？

如果你是 Cursor 的做法：你让他坐在你旁边，每次他要敲命令之前你看一眼，点个「允许」。简单粗暴，但你得一直盯着。

如果你是 GitHub Copilot Agent 的做法：你给他一台全新的虚拟机，让他在里面随便折腾。搞完了把代码提交上来，你审核后再合并。安全，但他看不到你本地的环境。

如果你是 Claude Code 的做法：

你让他直接用你的电脑——但你给他配了一套极其精密的安检系统。他能做什么、不能做什么、哪些操作需要你点头、哪些可以自己来、甚至他想用 rm -rf 都要经过 9 层审查才能执行。

这就是三种完全不同的安全哲学：

为什么 Anthropic 选了最难的那条路？

因为只有这样，AI 才能用你的终端、你的环境、你的配置来干活——这才是「真正帮你写代码」，而不是「在一个干净房间里给你写一段代码然后复制过来」。

但代价是什么？他们为此写了 51 万行代码。

二、你以为的 Claude Code vs 实际的 Claude Code

大多数人以为 AI 编程工具是这样的：

用户输入 → 调用 LLM API → 返回结果 → 显示给用户

Claude Code 实际是这样的：

用户输入
→ 动态组装 7 层系统提示词
→ 注入 Git 状态、项目约定、历史记忆
→ 42 个工具各自附带使用手册
→ LLM 决定使用哪个工具
→ 9 层安全审查（AST 解析、ML 分类器、沙箱检查...）
→ 权限竞争解析（本地键盘 / IDE / Hook / AI 分类器同时竞争）
→ 200ms 防误触延迟
→ 执行工具
→ 结果流式返回
→ 上下文接近极限？→ 三层压缩（微压缩 → 自动压缩 → 完全压缩）
→ 需要并行？→ 生成子 Agent 蜂群
→ 循环直到任务完成

相信大家都很好奇上面的是什么，不着急，让我们逐个拆开看。

三、第一个秘密：提示词不是写出来的，是「拼装」出来的

打开 src/constants/prompts.ts，你会看到这个函数：

注意到那个 SYSTEM_PROMPT_DYNAMIC_BOUNDARY 了吗？

这是一个缓存分界线。分界线上面的内容是静态的，Claude API 可以缓存它们，节省 token 费用。分界线下面的内容是动态的——你当前的 Git 分支、你的 CLAUDE.md 项目配置、你之前告诉它的偏好记忆……每次对话都不一样。

这意味着什么？

Anthropic 把提示词当成了编译器的输出来优化。静态部分是「编译后的二进制」，动态部分是「运行时参数」。这样做的好处是：

1. 省钱：静态部分走缓存，不重复计费

2. 快：缓存命中直接跳过这些 token 的处理

3. 灵活：动态部分让每次对话都能感知当前环境

每个工具都有独立的「使用手册」

更让我震惊的是：每个工具目录下都有一个 prompt.ts 文件——这是专门写给 LLM 看的使用手册。

看看 BashTool 的（src/tools/BashTool/prompt.ts，约 370 行）：

这不是写给人看的文档，这是写给 AI 看的行为准则。每次 Claude Code 启动时，这些规则都会被注入到系统提示词中。

这就是为什么 Claude Code 从不会擅自 git push --force，而某些工具会——不是模型更聪明，是提示词里已经把规矩讲清楚了。

而且 Anthropic 内部版本和你用的不一样

代码里大量出现这样的分支：

ant 就是 Anthropic 内部员工。他们的版本有更详细的代码风格指引（「不写注释除非 WHY 不明显」）、更激进的输出策略（「倒金字塔写作法」），以及一些仍在 A/B 测试的实验功能（Verification Agent、Explore & Plan Agent）。

这说明 Anthropic 自己就是 Claude Code 最大的用户。他们在用自己的产品来开发自己的产品。

四、第二个秘密：42 个工具，但你只看到了冰山一角

打开 src/tools.ts，会看到工具注册中心：

42 个工具，但大部分你从未直接看到过。因为很多工具是延迟加载的——只有当 LLM 需要时，才通过 ToolSearchTool 按需注入。

为什么这样做呢？

因为每多一个工具，系统提示词就要多一段描述，token 就要多花一份钱。如果你只是想让 Claude Code 帮你改一行代码，它不需要加载「定时任务调度器」和「团队协作管理器」。

还有一个更聪明的设计：

设置 CLAUDE_CODE_SIMPLE=true，Claude Code 就只剩三个工具：Bash、读文件、改文件。这是给极简主义者的后门。

所有工具都从同一个工厂出来

注意那些默认值：isConcurrencySafe 默认 false，isReadOnly 默认 false。

这叫 fail-closed 设计——如果一个工具的作者忘了声明安全属性，系统会假设它是「不安全的、会写入的」。宁可过度保守，也不漏掉一个风险。

「先读后改」的铁律

FileEditTool 会检查你是否已经用 FileReadTool 读过这个文件。如果没有，直接报错，不让改。

这就是为什么 Claude Code 不会像某些工具那样「凭空写一段代码覆盖你的文件」——它被强制要求先理解再修改。

五、第三个秘密：记忆系统——为什么它能「记住你」

用过 Claude Code 的人都有一个感受：它好像真的认识你。

你告诉它「不要在测试中 mock 数据库」，下次对话它就不会再 mock。你告诉它「我是后端工程师，React 新手」，它解释前端代码时就会用后端的类比。

这背后是一个完整的记忆系统。

用 AI 来检索记忆

Claude Code 用 另一个 AI（Claude Sonnet）来决定「哪些记忆和当前对话相关」。

不是关键词匹配，不是向量搜索——是让一个小模型快速扫描所有记忆文件的标题和描述，选出最多 5 个最相关的，然后把它们的完整内容注入到当前对话的上下文中。

策略是「精确度优先于召回率」——宁可漏掉一个可能有用的记忆，也不塞进一个不相关的记忆污染上下文。

KAIROS 模式：夜间「做梦」

这是最让我觉得科幻的部分。

代码中有一个叫 KAIROS 的特性标志。在这个模式下，长会话中的记忆不是存在结构化文件里，而是存在按日期的追加式日志中。然后，有一个 /dream 技能会在「夜间」（低活跃期）运行，把这些原始日志蒸馏成结构化的主题文件。

AI 在「睡觉」的时候整理记忆。这已经不是工程了，这是仿生学。

六、第五个秘密：它不是一个 Agent，是一群

当你让 Claude Code 做一个复杂任务时，它可能悄悄做了这件事：

它生成了一个子 Agent。

而且子 Agent 有严格的「自我意识」注入，防止它递归生成更多子 Agent：

这段代码在说：「你是一个工人，不是经理。别想着再雇人，自己干活。」

Coordinator 模式：经理模式

在协调器模式下，Claude Code 变成一个纯粹的任务编排者，自己不干活，只分配：

核心原则写在代码注释里：

「Parallelism is your superpower」只读研究任务：并行跑。写文件任务：按文件分组串行跑（避免冲突）。

Prompt Cache 的极致优化

为了最大化子 Agent 的缓存命中率，所有 fork 子代理的工具结果都使用相同的占位符文本：

「Fork started—processing in background」

为什么？因为 Claude API 的 prompt cache 是基于字节级前缀匹配的。如果 10 个子 Agent 的前缀字节完全一致，那么只有第一个需要「冷启动」，后面 9 个直接命中缓存。

这是一个每次调用节省几美分的优化，但在大规模使用下，能省下大量成本。

七、第六个秘密：三层压缩，让对话「永不超限」

所有 LLM 都有上下文窗口限制。对话越长，历史消息越多，最终一定会超出限制。

Claude Code 为此设计了三层压缩：

第一层：微压缩——最小代价

微压缩只动旧的工具调用结果——把「10 分钟前读的那个 500 行文件的内容」替换成 [Old tool result content cleared]。

提示词和对话主线完全保留。

第二层：自动压缩——主动收缩

当 token 消耗接近上下文窗口的 87%（窗口大小 - 13,000 buffer），自动触发。有一个熔断器：连续 3 次压缩失败后停止尝试，避免死循环。

第三层：完全压缩——AI 总结

让 AI 对整段对话生成摘要，然后用摘要替换所有历史消息。生成摘要时有一个严厉的前置指令：

为什么要这么严厉？因为如果总结过程中 AI 又去调用工具，就会产生更多的 token 消耗，适得其反。这段提示词就是在说：「你的任务是总结，别干别的。」

压缩后的 token 预算：

· 文件恢复：50,000 tokens

· 每个文件上限：5,000 tokens

· 技能内容：25,000 tokens

这些数字不是拍脑袋定的——它们是在「保留足够上下文继续工作」和「腾出足够空间接收新消息」之间的平衡点。

八、读完这份源码，我学到了什么

AI Agent 的 90% 工作量在「AI」之外

51 万行代码里，真正调用 LLM API 的部分可能不到 5%。其余 95% 是什么？

· 安全检查（18 个文件只为一个 BashTool）

· 权限系统（allow/deny/ask/passthrough 四态决策）

· 上下文管理（三层压缩 + AI 记忆检索）

· 错误恢复（熔断器、指数退避、Transcript 持久化）

· 多 Agent 协调（蜂群编排 + 邮箱通信）

· UI 交互（140 个 React 组件 + IDE Bridge）

· 性能优化（prompt cache 稳定性 + 启动时并行预取）

如果你正在做 AI Agent 产品，这才是你真正要解决的问题。不是模型够不够聪明，是你的脚手架够不够结实。

好的提示词工程是系统工程

不是写一段漂亮的 prompt 就完事了。Claude Code 的提示词是：

· 7 层动态组装

· 每个工具附带独立的使用手册

· 缓存边界精确划分

· 内部版本和外部版本有不同的指令集

· 工具排序固定以保持缓存稳定

这是工程化的提示词管理，不是手工艺。

为失败而设计

每一个外部依赖都有对应的失败策略：

Anthropic 把 Claude Code 当操作系统在做

42 个工具 = 系统调用权限系统 = 用户权限管理技能系统 = 应用商店 MCP 协议 = 设备驱动 Agent 蜂群 = 进程管理上下文压缩 = 内存管理 Transcript 持久化 = 文件系统

这不是一个「聊天机器人加几个工具」，这是一个以 LLM 为内核的操作系统。

总结

51 万行代码。1903 个文件。18 个安全文件只为一个 Bash 工具。

9 层审查只为让 AI 安全地帮你敲一行命令。

这就是 Anthropic 的答案：要让 AI 真正有用，你不能把它关在笼子里，也不能放它裸奔。你得给它建一套完整的信任体系。

而这套信任体系的代价，是 51 万行代码。

原文链接

点击了解律动BlockBeats 在招岗位

欢迎加入律动 BlockBeats 官方社群：

Telegram 订阅群：https://t.me/theblockbeats

Telegram 交流群：https://t.me/BlockBeats_App

Twitter 官方账号：https://twitter.com/BlockBeatsAsia

#Claude #AI #人工智能 #技术 #创新

纠错/举报

科普教程

学习，从这里开始

下载 BlockBeats

iOS Android

选择文库

新增文库

取消

完成

新增文库

仅自己可见

公开

保存

纠错/举报

提交