深度

Claude Code 上下文窗口管理完全指南:100 万 Token 的高效利用策略

Claude Code 超长上下文(100万 Token)完整使用指南:上下文窗口的构成(系统提示/工具定义/对话历史/当前请求)、会话压缩(Compaction)的触发机制与配置、--continue 跨会话续接上下文、如何避免上下文溢出、超大代码库的分批处理技巧、Prompt Caching 配合长上下文降低成本,以及 Token 计数工具的使用方法。

2026/3/184分钟 阅读ClaudeEagle

Claude Opus 4.6 和 Sonnet 4.6 拥有 100 万 tokens 的超大上下文窗口, 约等于 75 万汉字或 2 万行代码。合理管理上下文,能大幅提升工作效率。

上下文窗口的构成

每次请求中,上下文窗口被以下内容占用:

┌─────────────────────────────────────────┐ │ 系统提示(CLAUDE.md + 工具定义) │ ~5,000 tokens ├─────────────────────────────────────────┤ │ 对话历史(当前会话的所有消息) │ 可变,随对话增长 ├─────────────────────────────────────────┤ │ 当前请求(你的提问 + 相关文件内容) │ 可变 ├─────────────────────────────────────────┤ │ 保留给输出的空间 │ ~64,000 tokens └─────────────────────────────────────────┘ 总计:≤ 1,000,000 tokens

查看当前 Token 使用量

bash
# 在 Claude Code 交互模式中
/status   # 显示当前会话的 Token 使用情况

# 命令行查看上次会话统计
claude -p "hello" --output-format json | python3 -c "
import json, sys
d = json.load(sys.stdin)
print(f'本次消耗: {d.get("cost_usd", 0):.4f} USD')
"

会话压缩(Compaction)

当对话历史很长时,Claude Code 会自动压缩历史对话,保留关键信息:

自动压缩触发

json
// .claude/settings.json 配置
{
  "compaction": {
    "enabled": true,
    "threshold": 0.8  // 上下文使用率超过 80% 时触发
  }
}

手动触发压缩

bash
# 在交互会话中
/compact   # 立即压缩当前对话历史

# 指定保留最近 N 轮
/compact 10  # 保留最近 10 轮对话,其余压缩为摘要

压缩原理

压缩不是删除,而是将老旧对话转为结构化摘要

原始对话(50轮,约 80K tokens) ↓ 压缩 摘要(约 5K tokens)+ 最近 10 轮完整对话(约 15K tokens) = 20K tokens(节省 75%)

--continue:跨会话续接上下文

bash
# 继续最近一次会话
claude --continue
claude -c  # 简写

# 继续时执行特定任务
claude -c -p "继续刚才的重构,处理 services/ 目录"

# 通过会话 ID 恢复特定会话
claude -r "session_abc123" "继续处理支付模块"

# 为会话命名(方便后续引用)
claude -r "payment-refactor" "开始支付模块重构"

超大代码库处理策略

策略一:--add-dir 扩展工作目录

bash
# 让 Claude 同时访问多个目录
claude --add-dir ../shared-lib --add-dir ../api-sdk

# 适合 monorepo:可以跨包分析依赖关系

策略二:分批读取,用摘要传递上下文

bash
# 第一阶段:分析架构
claude "请分析 src/ 目录的整体架构,输出架构摘要"

# 保存摘要
claude -p "分析架构" > architecture-summary.md

# 第二阶段:基于摘要深入某个模块
cat architecture-summary.md | claude -p "基于以上架构,详细分析 src/payment/ 模块的问题"

策略三:.claudeignore 精准控制读取范围

# 只让 Claude 看核心源码,排除非必要文件 node_modules/ dist/ *.test.ts # 先排除测试,专注主逻辑 docs/ # 排除文档,节省 Token

Prompt Caching 配合长上下文

长系统提示(CLAUDE.md)每次都会重复发送,使用 Prompt Caching 只付一次费:

python
# 通过 API 使用时,标记长系统提示为可缓存
response = client.messages.create(
    model="claude-sonnet-4-6",
    system=[
        {
            "type": "text",
            "text": open("CLAUDE.md").read(),  # 可能有几千 tokens
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[{"role": "user", "content": user_input}]
)
# 缓存命中时,这部分 Token 费用降低 90%

Token 成本估算

以 Sonnet 4.6 为例($3/M 输入,$15/M 输出):

场景输入 Tokens成本
普通对话(10 轮)~10K$0.03
中型项目分析(50 轮)~200K$0.60
大型代码库全量读取~500K$1.50
100 万 Token 满窗口~1M$3.00

实际使用中,大多数任务 10-50K tokens 就够了。 配合会话压缩和 .claudeignore,日常成本通常 $0.1-0.5/天。


来源:Claude Code 官方文档 - docs.anthropic.com/en/docs/claude-code

相关文章推荐

深度Claude Code 底层原理详解:代理循环、工具系统与上下文窗口管理Claude Code 底层原理深度解析:代理循环(收集上下文/执行动作/验证结果)、五类内置工具体系(文件/搜索/命令/Web/代码智能)、上下文窗口管理(监控/清理策略)、权限控制模式,以及与普通聊天工具的本质差异。2026/3/13深度Claude Code Skills vs CLAUDE.md vs Plugins vs Sub-agents:何时用哪个的完整决策指南Claude Code 四种扩展机制的完整决策指南:四种机制本质对比表;CLAUDE.md 适合放/不适合放的内容清单(含内容精简测试);Skills 四种模式和完整决策树;Plugins 与 Skills 的选择对比表及 Token 开销警告;Sub-agents 三种触发方式和 context: fork 对比;四种组合使用模式;以及快速决策查询表(12 个场景)。2026/5/10深度2026 企业 AI Agent 现状报告:80% 已获可量化 ROI,编程是突破口Anthropic 联合 Material 公司调研 500+ 技术领导者的《2026 State of AI Agents Report》:57% 已部署多阶段工作流;86% 在生产代码部署 Agent;80% 报告可量化 ROI;编程时间节省覆盖规划/代码生成/文档/测试各 58-59%;真实案例(Doctolib 功能交付快 40%、eSentire 威胁分析从 5 小时到 7 分钟、L'Oréal 44000 月活数据直查);三大规模化挑战;以及企业 Claude Code 四阶段部署路径。2026/5/7深度Claude Code Auto Mode 技术深度解析:两层分类器架构如何防止 AI 越权行为Anthropic 工程博客深度解析 Auto Mode 背后的技术:用户审批了 93% 的权限请求却仍有疲劳感;内部事故日志(误删远程分支/上传 GitHub Token/生产数据库误迁移);两层防御(输入层提示注入探针+输出层对话记录分类器);三层许可决策;实测数据(0.4% 误报率,17% 漏报率,附原因分析);多 Agent 传递的安全处理;以及 Deny-and-Continue 机制。2026/5/3深度Claude Code Agent Teams 深度解析:Opus 4.6 的点对点多 Agent 协作架构详解Claude Code Agent Teams 完整解析:与 Subagents 的本质架构差异(Mailbox 点对点 vs 父子层级)、Team Lead/Teammates/Mailbox/Shared Task List 四大组件、启用方法、5 种实用团队模式(全栈三人组/大迁移/安全审查/微服务/测试冲刺),以及成本控制建议。2026/4/19深度Claude Code 记忆系统深度解析:CLAUDE.md、Auto Memory、.claude/rules/ 如何协同Claude Code 记忆系统完整解析:CLAUDE.md 和 Auto Memory 的分工、四种作用域配置、.claude/rules/ 路径感知规则用法、写有效指令的 4 个原则,以及记忆不生效的排查方法。2026/4/13