教程

Claude Code 上下文管理完全指南:防止 Token 浪费的 7 个核心策略

Claude Code 上下文管理 7 个核心策略:/compact 主动压缩(每 30-40 条消息)vs /clear 完全重置的选择;@ 精确指定上下文文件;探索会话和执行会话分离;用 CLAUDE.md 替代重复指令(节省 Token 并提升缓存命中率);多 Terminal 按任务分组管理;/usage 监控用量热点(v2.1.105);以及 Prompt Cache 1 小时 TTL 优化(API 用户)。含 Opus 4.7 真正 1M 上下文的正确使用方式。

2026/5/36分钟 阅读ClaudeEagle

Claude Code 最常见的问题之一:上下文越来越长,Claude 开始"忘事",性能下降,额度消耗加速。这篇文章系统梳理 7 个上下文管理策略,帮你在长时间工作中保持 Claude Code 的高水准表现。


为什么上下文管理这么重要?

LLM 的上下文窗口是有限资源。当上下文过长时:

  • 较早的信息会被"推远",注意力下降
  • Token 消耗加速(每次请求都要发送完整上下文)
  • 性能下降(Claude 在非常长的上下文里会遗漏细节)
  • 缓存命中率下降(长上下文变化频繁,缓存失效)

Opus 4.7 有 1M Token 上下文,但不代表可以无限堆积——即使在 1M 窗口内,长上下文也会影响推理质量。


策略 1:主动用 /compact,而不是被动等

错误做法:等到 Claude 开始表现变差了才想起来处理

正确做法:每 30-40 条消息主动运行一次

> /compact

/compact 把对话历史压缩成摘要,保留最重要的上下文,释放 Token 空间。压缩后的摘要比原始对话历史小得多,但保留了关键决策和状态。

何时特别需要 /compact

  • 开始了一个新的子任务
  • 已经解决了一个问题,开始下一个
  • 发现 Claude 开始重复之前做过的分析

策略 2:任务边界用 /clear

/compact/clear 的区别

  • /compact:压缩历史,保留摘要,继续在当前任务上下文里工作
  • /clear:清除全部上下文,完全重新开始

适合用 /clear 的场景

  • 完全切换到不相关的任务
  • 上一个任务已经完成,准备开始全新的工作
  • 当前上下文里有太多"噪音"干扰新任务
# 完成了 auth 模块的重构 > /clear # 重新开始,处理完全不同的 UI 组件

策略 3:用 @ 精确指定上下文,而非让 Claude 搜索

低效(Claude 需要搜索整个代码库):

> 帮我优化用户登录的错误处理

高效(精确指定):

> @src/api/auth.ts 优化第 142-180 行的错误处理逻辑, 参考 @src/types/errors.ts 里定义的错误类型

精确指定文件路径:

  1. 减少搜索时间
  2. 减少无关文件进入上下文
  3. Claude 的注意力更集中

策略 4:分离探索会话和执行会话

bash
# 第一个 Terminal:只读探索
claude --allowedTools Read,Grep,Glob

# 在这里分析代码库,理解架构,制定计划
# 不做任何修改,上下文保持干净

# 第二个 Terminal:执行
claude

# 基于探索阶段的结论,执行具体任务

探索阶段往往会产生大量"观察"和"思考"内容,这些内容在执行阶段不再需要。分离两个会话可以让执行阶段保持干净的上下文。


策略 5:用 CLAUDE.md 替代重复指令

每次都要重复(浪费上下文):

> 记住要用 TypeScript strict 模式,用 Zod 验证输入, 不要直接暴露数据库 ID,用 UUID 替代... [重复 20 次同样的内容]

一次配置,永久生效

markdown
# CLAUDE.md

## 代码规范(每次都必须遵守)
- 使用 TypeScript strict 模式
- 所有 API 输入用 Zod 验证
- 对外 ID 统一用 UUID,不暴露数据库自增 ID
- SQL 查询必须使用参数化查询

CLAUDE.md 的内容在每次会话开始时自动加载,不占用对话历史 Token,且可以用 Prompt Cache 缓存(大幅降低成本)。


策略 6:用 Session 分组管理任务

按任务类型开不同 Terminal

Terminal 1:长期功能开发(保持持续 Session) Terminal 2:Bug 修复(每个 Bug 用 /clear 重置) Terminal 3:代码审查(只读,经常 /clear) Terminal 4:实验性探索(随意,不担心污染其他 Session)

不同性质的任务有不同的上下文需求:

  • 长期功能开发需要记住架构决策 → 保持 Session,定期 /compact
  • Bug 修复通常是独立的 → 每次用 /clear 开始
  • 代码审查不需要修改状态 → 只读工具,经常 /clear

策略 7:用 /usage 监控,找到消耗热点

> /usage

新的 /usage 命令(v2.1.105)显示用量细分:

  • 并行 Session 占比
  • Subagent 调用占比
  • 缓存未命中占比(重点关注)
  • 长上下文占比

缓存未命中率高:说明上下文变化频繁,考虑稳定 CLAUDE.md 内容,减少每次会话的变量部分。

Subagent 调用多:检查是否可以把任务设计得更集中,减少子任务切换。

长上下文占比高:提醒自己用 /compact 更频繁。


Prompt Cache 优化(API 用户)

对于使用 Claude API 的用户,开启 1 小时缓存 TTL:

bash
export ENABLE_PROMPT_CACHING_1H=1

什么会被缓存

  • CLAUDE.md 内容(稳定,高缓存命中率)
  • System Prompt
  • 较早的对话历史(稳定部分)

什么会缓存失效

  • 每次新的用户消息
  • 每次工具调用结果

策略:把稳定的内容(规范、架构文档)放到 CLAUDE.md,通过 @ 引入,而不是在对话里重复发送。


各场景推荐配置

场景策略
长时间功能开发(>2小时)每 40 条消息 /compact,任务切换 /clear
大型代码库探索先只读 Session 探索,再开新 Session 执行
多任务并行每个任务独立 Terminal,互不干扰
Bug 修复每个 Bug 用 /clear 开新 Session
团队共享工作流把所有规范放 CLAUDE.md(提交到 git)

Opus 4.7 的 1M 上下文的正确使用方式

Opus 4.7 的真正 1M 上下文(v2.1.119 修复了显示不准确的问题)适合:

  • 分析超大型代码库(一次性加载整个项目)
  • 长时间的 Agent 任务(不需要频繁 /compact)
  • 复杂的跨文件重构

即使有 1M 上下文,以上策略仍然有价值:减少不必要的 Token 消耗,降低成本,让 Claude 的注意力更集中在当前任务相关的内容上。


来源:Claude Code 官方文档 - Interactive Mode | Anthropic API 缓存文档 | 整理:ClaudeEagle

相关文章推荐

教程Claude Code 成本控制完全指南:7 个优化策略从每月 $500 降到 $80Claude Code Token 费用完整优化指南:/cost 分析账单构成、利用提示缓存(最高 ROI)、按任务切换 Haiku/Sonnet/Opus 模型、.claudeignore 一次性配置(节省 20-40%)、精炼 CLAUDE.md(每 Token 价值最大化)、Subagent 隔离上下文密集型任务、主动 /compact(节省 66% 输入 Token),以及 Claude Max 订阅的合适时机。2026/4/23教程Claude Code 上下文窗口管理完全指南:防止 Token 浪费的 7 个核心策略Claude Code 上下文管理完整指南:7 个核心策略——主动 /compact(70% 时机)、一 Session 一任务、.claudeignore 源头控制、临时 Markdown 文件传递上下文、Subagent 隔离探索、Plan Mode 减少探索消耗、精炼 CLAUDE.md。按优先级排序,附优先级矩阵。2026/4/21教程Claude Code 2026 完整新手指南:从安装到高级工作流(官方权威版)Claude Code 2026 全面入门教程:安装(4 种方式)、登录(包含 WSL2 粘贴 OAuth 代码)、定价对比(Pro/Max/Teams/Enterprise/Console);核心命令速查(启动模式/15 个 Slash 命令/键盘快捷键/权限确认说明);五大核心工作流(写代码/理解代码/修复 Bug/测试/Git 和 PR);CLAUDE.md 配置(/init 生成 + 最佳实践);Hooks 事件自动化;Skills 按需加载;成本优化技巧;Auto Mode + hard_deny 安全配置;以及 2026 年高级功能(Routines/Sub-agents/Computer Use/Remote Control/AutoDream/Ultraplan)。2026/5/12教程Claude Code Sub-agents 官方完整指南:内置 Agent、自定义配置、并行模式和 Fork 会话Claude Code Sub-agents 官方文档完整整理:解决的核心问题(保护上下文/成本控制);三个内置 Sub-agent(Explore/Plan/General-purpose 及各自模型和工具);/agents 创建流程(界面/描述生成/工具选择/持久内存配置);完整 Frontmatter 字段参考;模型选择策略(Haiku 探索→Sonnet 审查→Opus 复杂任务);MCP 服务器限定到 Sub-agent;自动委托 vs 显式调用;前台/后台运行;隔离高容量/并行调研/链式 Sub-agent 三种模式;Fork 会话(与命名 Sub-agent 的区别);以及 4 个官方示例配置。2026/5/8教程Claude Code 官方最佳实践完全指南:Anthropic 工程团队总结的 25 条黄金法则Anthropic 官方 Best Practices 完整整理:核心约束(上下文管理);给 Claude 可验证标准(最高杠杆);探索→规划→实现→提交四步流程;精准提示 4 策略;丰富上下文输入方式;CLAUDE.md 有效写法(含 ✅/❌ 清单和 @ 引入语法);权限预设;CLI 工具配置;MCP 服务器选择;Hooks 自动化;Skills vs CLAUDE.md 选择;高效沟通技巧;会话管理(提前纠正/激进 /compact/Subagent 调研);以及非交互模式和多 Session 并行的规模化技巧。2026/5/8教程Claude Code 自定义 Agents 完整指南:创建专用 AI 编程助手Claude Code 自定义 Agents 完整指南:Agent 定义文件格式(Frontmatter 字段:name/description/tools/permissionMode/model/effort/context);4 种调用方式(/agents 界面/--agent CLI/对话提及/Print 模式自动化);4 个实战 Agent 配置(安全审查员/数据库优化顾问/无障碍合规检查/TypeScript 类型安全/CI 失败分析师);skillOverrides 控制可见性;context: fork 独立上下文;以及在 GitHub Actions 里使用 Agent 的 CI 配置示例。2026/5/7