这是 2026 年使用 Claude API 构建生产应用的完整参考。覆盖模型选型、Prompt 缓存(最高节省 90% 成本)、自适应推理(替代旧的 budget_tokens)、工具调用、流式响应和视觉能力。
模型选型和定价(2026 年当前)
| 模型 | 输入价格/百万 Token | 输出价格/百万 Token | 上下文窗口 | 最适合 |
|---|---|---|---|---|
| claude-haiku-4-5 | $1.00 | $5.00 | 200K | 高频简单任务 |
| claude-sonnet-4-6 | $3.00 | $15.00 | 200K(1M Beta) | 大多数生产用例 |
| claude-opus-4-6 | $5.00 | $25.00 | 200K(1M Beta) | Agent 工作流,复杂推理 |
| claude-opus-4-7 | $5.00 | $25.00 | 200K | 最强编程,长时间 Agent |
推荐:大多数生产用例默认用 Sonnet 4.6(性价比最优)。Agent 编程和复杂推理用 Opus。
基础设置
python
# Python SDK
pip install anthropic
from anthropic import Anthropic
client = Anthropic(api_key="sk-ant-xxx") # 或用 ANTHROPIC_API_KEY 环境变量
# 基础调用
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[
{"role": "user", "content": "用 3 句话解释 async/await"}
]
)
print(message.content[0].text)typescript
// TypeScript SDK
npm install @anthropic-ai/sdk
import Anthropic from '@anthropic-ai/sdk';
const anthropic = new Anthropic({
apiKey: process.env.ANTHROPIC_API_KEY,
});
const message = await anthropic.messages.create({
model: 'claude-sonnet-4-6',
max_tokens: 1024,
system: `你是一位资深 TypeScript 工程师。保持简洁精确。`,
messages: [
{ role: 'user', content: '写一个异步函数的重试封装器' }
],
});Prompt 缓存:最高节省 90% 成本
这是 Claude API 最强大的成本优化功能。对于重复发送的长 System Prompt 或上下文,标记后缓存,后续请求节省约 90%。
缓存原理
不带缓存:每次请求都付完整的 System Prompt Token 费用
带缓存:
- 首次请求:写入缓存(比普通输入贵 25%)
- 后续请求(5 分钟内):读取缓存(比普通输入便宜约 90%)
缓存 System Prompt
python
from anthropic import Anthropic
client = Anthropic()
# 将稳定的长 System Prompt 标记为缓存
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text":