2026 年 7 月 3 日,Claude Code 发布 v2.1.201——紧随 v2.1.200 之后的一个小版本,专注于优化 Claude Sonnet 5 会话的底层消息处理机制。
核心变更
Claude Sonnet 5 sessions no longer use the mid-conversation system role for harness reminders. (Claude Sonnet 5 会话不再使用「对话中系统角色」来传递 Harness 提醒信息。)
这是一项底层技术优化,理解它需要先了解 Claude Code 的一个已知痛点。
背景:Mid-conversation System Messages 是什么
在 Agentic 工作流中,Claude Code 的「Harness」(运行时框架)需要不时向模型插入提醒信息(比如「记得检查测试是否通过」「当前处于 Plan Mode」等)。
过去的实现方式:这些提醒被插入为对话中途的 System 角色消息。
存在的问题:在长对话中,中途插入系统消息会破坏 Prompt Cache,因为 Prompt Cache 依赖前缀匹配,一旦中途插入新内容,后续所有内容都需要重新计算,导致每次插入提醒都会产生额外的延迟和成本。
v2.1.201 的优化
针对 Claude Sonnet 5 会话,v2.1.201 改用了不会破坏 Prompt Cache 的方式来传递 Harness 提醒信息,具体机制细节由 Anthropic 内部处理,对用户完全透明。
实际影响
对于使用 Claude Sonnet 5 的 Claude Code 用户,这个优化带来:
- 更高的 Prompt Cache 命中率:长会话中途不再因为系统提醒而破坏缓存
- 更低的 Token 成本:缓存命中意味着输入成本大幅降低(可达 90% 的输入 Token 节省)
- 更快的响应速度:缓存命中的请求响应明显更快
与 Claude API 官方修复的关联
这项修复与 Anthropic 更早在 Claude API 层面发布的「Mid-conversation System Messages」问题修复一脉相承——两者都是为了解决长 Agentic 会话中 Prompt Cache 因系统消息插入而失效的问题。
如果你的项目大量使用 Claude Sonnet 5 + Claude Code 进行长时间 Agent 会话(比如后台代理长时间运行的任务),这项优化会直接体现为更低的账单成本。
升级方式
npm update -g @anthropic-ai/claude-code
claude --version
# Claude Code 2.1.201 或更高
# 确认当前使用 Sonnet 5
claude /model总结
v2.1.201 虽然只有一条更新说明,但对于重度使用 Claude Sonnet 5 + Claude Code 长会话的开发者来说,这是一项直接影响成本和速度的底层优化,值得升级体验。
来源:Claude Code Changelog v2.1.201 — Anthropic,2026-07-03