Claude API 批量处理指南：Message Batches API 节省 50% 成本实战（2026）

当你需要处理大量文档、翻译海量内容或批量分类数据时， Claude 的 Message Batches API 是最经济高效的选择—— 比标准 API 节省 50% 成本，同时突破实时 Rate Limit 限制。

什么是 Message Batches API？

特性	标准 API	Batches API
响应方式	实时（秒级）	异步（最长 24 小时）
成本	100%	50%（折半）
Rate Limit	受 RPM/TPM 限制	不受实时限流影响
适用场景	需要实时结果	可以等待批量结果
每批最大请求数	-	10,000 条

适合使用的场景：

批量翻译文档/文章
大规模数据分类标注
批量生成摘要/描述
数据集质量评估
批量代码审查

Python 完整示例

python

import anthropic
import json
import time

client = anthropic.Anthropic()

# === 1. 准备批量请求 ===
def create_batch_requests(texts: list[str], task: str) -> list:
    requests = []
    for i, text in enumerate(texts):
        requests.append({
            "custom_id": f"request-{i}",  # 用于匹配结果
            "params": {
                "model": "claude-haiku-3-5",  # 批量任务推荐 Haiku（更便宜）
                "max_tokens": 200,
                "messages": [{
                    "role": "user",
                    "content": f"{task}\n\n{text}"
                }]
            }
        })
    return requests

# === 2. 提交批次 ===
def submit_batch(requests: list):
    batch = client.beta.messages.batches.create(requests=requests)
    print(f"批次已提交: {batch.id}")
    print(f"状态: {batch.processing_status}")
    print(f"请求数: {batch.request_counts.processing}")
    return batch.id

# === 3. 轮询进度 ===
def wait_for_batch(batch_id: str, poll_interval: int = 30):
    while True:
        batch = client.beta.messages.batches.retrieve(batch_id)
        counts = batch.request_counts
        total = counts.processing + counts.succeeded + counts.errored
        done = counts.succeeded + counts.errored
        print(f"进度: {done}/{total} | 成功: {counts.succeeded} | 失败: {counts.errored}")

        if batch.processing_status == "ended":
            print(f"批次完成！结果文件: {batch.results_url}")
            return batch
        
        time.sleep(poll_interval)

# === 4. 获取结果 ===
def get_results(batch_id: str) -> dict:
    results = {}
    for result in client.beta.messages.batches.results(batch_id):
        if result.result.type == "succeeded":
            results[result.custom_id] = result.result.message.content[0].text
        else:
            results[result.custom_id] = f"ERROR: {result.result.error.type}"
    return results

# === 完整流程 ===
texts = [
    "Artificial intelligence is transforming software development...",
    "The latest Claude model shows significant improvements...",
    # ... 更多文本
]

requests = create_batch_requests(texts, "请将以下英文翻译成中文：")
batch_id = submit_batch(requests)
batch = wait_for_batch(batch_id)
results = get_results(batch_id)

for custom_id, translation in results.items():
    print(f"{custom_id}: {translation[:50]}...")

Node.js 示例

typescript

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic();

async function batchClassify(items: string[]) {
  // 提交批次
  const batch = await client.beta.messages.batches.create({
    requests: items.map((item, i) => ({
      custom_id: `item-${i}`,
      params: {
        model: "claude-haiku-3-5",
        max_tokens: 50,
        messages: [{
          role: "user" as const,
          content: `将以下文本分类为：正面/负面/中性。只输出类别词。\n\n${item}`
        }]
      }
    }))
  });

  console.log(`批次 ID: ${batch.id}`);

  // 等待完成
  let current = batch;
  while (current.processing_status !== "ended") {
    await new Promise(r => setTimeout(r, 30000)); // 等 30 秒
    current = await client.beta.messages.batches.retrieve(batch.id);
    const { succeeded, errored, processing } = current.request_counts;
    console.log(`进度: 成功 ${succeeded}, 失败 ${errored}, 处理中 ${processing}`);
  }

  // 收集结果
  const results: Record<string, string> = {};
  for await (const result of await client.beta.messages.batches.results(batch.id)) {
    if (result.result.type === "succeeded") {
      results[result.custom_id] = result.result.message.content[0].type === "text"
        ? result.result.message.content[0].text : "";
    }
  }
  return results;
}

典型场景：批量文档摘要

python

import os, glob

def batch_summarize_documents(docs_dir: str):
    # 读取所有 .txt 文件
    files = glob.glob(f"{docs_dir}/*.txt")
    texts = {}
    for path in files:
        with open(path) as f:
            texts[os.path.basename(path)] = f.read()[:4000]  # 限制长度
    
    # 构建批量请求
    requests = [{
        "custom_id": filename,
        "params": {
            "model": "claude-haiku-3-5",
            "max_tokens": 300,
            "messages": [{
                "role": "user",
                "content": f"用 3 句话概括以下文档的核心内容：\n\n{content}"
            }]
        }
    } for filename, content in texts.items()]
    
    # 提交（每批最多 10000 条）
    batch = client.beta.messages.batches.create(requests=requests[:10000])
    print(f"提交 {len(requests)} 篇文档，批次 ID: {batch.id}")
    return batch.id

成本计算示例

处理 10,000 篇文章（每篇平均 500 token 输入 + 100 token 输出）：

方式	输入成本	输出成本	总计
标准 API（Haiku）	$0.25/M → $1.25	$1.25/M → $0.75	$2.00
Batches API	50% 折扣 → $0.63	50% 折扣 → $0.38	$1.01

每批 10K 条节省约 $1，大规模场景下节省显著。

最佳实践

选 Haiku 模型：批量任务通常不需要最强模型，Haiku 成本最低
合理设置 max_tokens：分类任务 50 token，摘要 300 token，翻译按原文比例
使用有意义的 custom_id：便于结果匹配，如文件名、数据库 ID
处理错误结果：批次中部分请求可能失败，代码要能处理 errored 状态
保存 batch_id：进程重启后可以根据 ID 继续获取结果

来源：Message Batches API - Anthropic 官方文档

Claude API 批量处理完全指南：Message Batches API 大规模数据处理实战

什么是 Message Batches API？

Python 完整示例

Node.js 示例

典型场景：批量文档摘要

成本计算示例

最佳实践

相关文章推荐

什么是 Message Batches API？#

Python 完整示例#

Node.js 示例#

典型场景：批量文档摘要#

成本计算示例#

最佳实践#

相关文章推荐

什么是 Message Batches API？

Python 完整示例

Node.js 示例

典型场景：批量文档摘要

成本计算示例

最佳实践