教程

Anthropic Claude API 完整开发指南 2026:Prompt 缓存、自适应推理、工具调用全解析

Claude API 2026 年完整开发指南:模型选型和最新定价(Haiku/Sonnet/Opus 对比)、Prompt 缓存实现(最高节省 90% 成本,含代码示例)、自适应推理替代旧 budget_tokens(含流式实现)、工具调用完整循环、流式响应(含 Next.js App Router 示例)、视觉能力(Opus 4.7 支持 3.75MP),以及生产最佳实践(重试、成本监控)。

2026/4/242分钟 阅读ClaudeEagle

这是 2026 年使用 Claude API 构建生产应用的完整参考。覆盖模型选型、Prompt 缓存(最高节省 90% 成本)、自适应推理(替代旧的 budget_tokens)、工具调用、流式响应和视觉能力。


模型选型和定价(2026 年当前)

模型输入价格/百万 Token输出价格/百万 Token上下文窗口最适合
claude-haiku-4-5$1.00$5.00200K高频简单任务
claude-sonnet-4-6$3.00$15.00200K(1M Beta)大多数生产用例
claude-opus-4-6$5.00$25.00200K(1M Beta)Agent 工作流,复杂推理
claude-opus-4-7$5.00$25.00200K最强编程,长时间 Agent

推荐:大多数生产用例默认用 Sonnet 4.6(性价比最优)。Agent 编程和复杂推理用 Opus。


基础设置

python
# Python SDK
pip install anthropic

from anthropic import Anthropic

client = Anthropic(api_key="sk-ant-xxx")  # 或用 ANTHROPIC_API_KEY 环境变量

# 基础调用
message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "用 3 句话解释 async/await"}
    ]
)

print(message.content[0].text)
typescript
// TypeScript SDK
npm install @anthropic-ai/sdk

import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  system: `你是一位资深 TypeScript 工程师。保持简洁精确。`,
  messages: [
    { role: 'user', content: '写一个异步函数的重试封装器' }
  ],
});

Prompt 缓存:最高节省 90% 成本

这是 Claude API 最强大的成本优化功能。对于重复发送的长 System Prompt 或上下文,标记后缓存,后续请求节省约 90%。

缓存原理

不带缓存:每次请求都付完整的 System Prompt Token 费用 带缓存: - 首次请求:写入缓存(比普通输入贵 25%) - 后续请求(5 分钟内):读取缓存(比普通输入便宜约 90%)

缓存 System Prompt

python
from anthropic import Anthropic

client = Anthropic()

# 将稳定的长 System Prompt 标记为缓存
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": 

相关文章推荐

教程Claude Cache Diagnostics 教程:定位 Prompt Cache Miss 的真正原因Claude Cache Diagnostics 解决 prompt cache miss 难排查问题。通过传入上一次 response id,API 会比较请求 fingerprint,告诉你 model/system/tools/messages 哪个部分破坏了缓存 prefix。2026/6/6教程Claude MCP Tunnels 指南:不用开放入站端口,也能把私有 MCP 服务接给 ClaudeMCP Tunnels 是 Anthropic 面向企业内网 MCP 服务的 beta 能力,通过 outbound-only 连接、cloudflared、proxy、inner TLS 和 OAuth,让 Claude 安全访问私有工具与数据源。2026/6/6教程Claude Mid-conversation System Messages 使用指南:长会话不再破坏 Prompt CacheClaude Opus 4.8 新增 mid-conversation system messages,可在长会话中途追加系统级指令,不改顶层 system prompt,从而保持缓存 prefix 命中,降低 Agent 循环成本。2026/6/6教程Claude Citations 完整指南:让 AI 回答带可验证引用,适合 RAG 与文档问答Claude Citations 官方能力中文整理:如何启用 citations.enabled、支持的文档类型、PDF 页码引用、文本字符索引、custom content block 索引、RAG chunk 粒度控制、与 Prompt Caching 兼容性和 Structured Outputs 不兼容限制。2026/5/21教程Claude Batch Processing 完整指南:批量处理任务如何节省 50% API 成本Claude Batch Processing 官方能力中文整理:为什么批处理能省钱、如何创建 batch、custom_id 设计、轮询状态、下载结果、处理失败请求,以及适合大规模分类、摘要、翻译、数据清洗的任务模式。2026/5/21教程Claude Prompt Caching 完整指南:降低长上下文成本与延迟的 API 实战Claude Prompt Caching 官方能力中文整理:适合缓存的内容、cache_control 使用方法、缓存断点策略、长文档和工具定义复用、成本/延迟收益、常见坑和生产环境落地建议。2026/5/21