教程

Claude Code LLM Gateway 配置指南:LiteLLM 统一端点、动态 API Key 与三大提供商直通

Claude Code LLM Gateway 配置完整指南:Gateway 五大价值(集中认证/用量追踪/费用控制/审计日志/模型路由)、三种 API 格式兼容要求(Anthropic Messages/Bedrock/Vertex 的 Headers 透传规则)、LiteLLM 静态 API Key 和动态 Key(三步配置:脚本+apiKeyHelper+TTL)、四种端点配置(统一端点推荐/Claude 直通/Bedrock 直通/Vertex 直通)、自定义模型名称设置,以及企业完整配置示例。

2026/3/64分钟 阅读ClaudeEagle

LLM Gateway 在 Claude Code 和模型提供商之间提供集中代理层,统一管理 API Key、追踪用量、控制成本、记录审计日志,并在不修改代码的情况下在提供商之间切换。

LLM Gateway 能解决什么问题

能力说明
集中认证单点管理 API Key,员工不直接接触 Anthropic Key
用量追踪按团队、按项目监控 Token 消耗
费用控制设置预算上限和速率限制
审计日志记录所有模型交互,满足合规要求
模型路由无需改代码在提供商之间切换

Gateway 接入要求

LLM Gateway 要兼容 Claude Code,必须支持以下至少一种 API 格式,并正确透传关键 Headers/Body 字段:

API 格式端点必须透传
Anthropic Messages(推荐)/v1/messages/v1/messages/count_tokens请求头:anthropic-betaanthropic-version
Bedrock InvokeModel/invoke/invoke-with-response-streamBody 字段:anthropic_betaanthropic_version
Vertex rawPredict:rawPredict:streamRawPredict/count-tokens:rawPredict请求头:anthropic-betaanthropic-version

⚠️ 未透传这些 Headers/Body 字段会导致 Claude Code 功能降级甚至无法使用。如果用 Anthropic Messages 格式访问 Bedrock 或 Vertex,可能需要设置 CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1

LiteLLM 配置详解

⚠️ LiteLLM 是第三方代理服务,Anthropic 不背书、不维护、不审计其安全性。以下信息仅供参考,可能滞后于 LiteLLM 最新版本。

前置要求

  • Claude Code 更新到最新版本
  • LiteLLM Proxy Server 已部署并可访问
  • 通过所选提供商有 Claude 模型访问权限

认证方式一:静态 API Key

最简单的方式,使用固定 API Key:

bash
# 环境变量方式
export ANTHROPIC_AUTH_TOKEN=sk-litellm-static-key
json
// settings.json 方式
{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "sk-litellm-static-key"
  }
}

此值将作为 Authorization Header 发送。

认证方式二:动态 API Key(推荐企业场景)

支持轮换 Key 或按用户认证,三步配置:

第一步:创建 Key 获取脚本

bash
#!/bin/bash
# ~/bin/get-litellm-key.sh

# 示例:从 Vault 获取 Key
vault kv get -field=api_key secret/litellm/claude-code

# 示例:生成 JWT Token
jwt encode \
  --secret="${JWT_SECRET}" \
  --exp="+1h" \
  '{"user":"'${USER}'","team":"engineering"}'

第二步:配置 Claude Code 使用该脚本

json
{
  "apiKeyHelper": "~/bin/get-litellm-key.sh"
}

第三步:设置 Token 刷新间隔

bash
# 每小时刷新一次(3600000 毫秒)
export CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000

获取的 Key 将同时作为 AuthorizationX-Api-Key Header 发送。

apiKeyHelper 优先级低于 ANTHROPIC_AUTH_TOKENANTHROPIC_API_KEY

三种端点配置方式

方式一:统一端点(推荐)

使用 LiteLLM 的 Anthropic 格式端点:

bash
export ANTHROPIC_BASE_URL=https://litellm-server:4000

统一端点的优势

  • 负载均衡
  • 故障转移(Fallbacks)
  • 一致的成本追踪和用户追踪支持

方式二:Claude API 直通

bash
export ANTHROPIC_BASE_URL=https://litellm-server:4000/anthropic

方式三:Amazon Bedrock 直通

bash
export ANTHROPIC_BEDROCK_BASE_URL=https://litellm-server:4000/bedrock
export CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
export CLAUDE_CODE_USE_BEDROCK=1

方式四:Google Vertex AI 直通

bash
export ANTHROPIC_VERTEX_BASE_URL=https://litellm-server:4000/vertex_ai/v1
export ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
export CLAUDE_CODE_SKIP_VERTEX_AUTH=1
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5

自定义模型名称

如果在 Gateway 中配置了自定义模型名称,使用 Model Configuration 环境变量匹配:

bash
# 主模型(用于大多数任务)
export ANTHROPIC_MODEL=my-gateway-sonnet

# 小模型(用于 Explore Agent 等低延迟场景)
export ANTHROPIC_SMALL_FAST_MODEL=my-gateway-haiku

企业部署完整配置示例

json
// ~/.claude/settings.json 或托管策略配置
{
  "apiKeyHelper": "/usr/local/bin/get-company-claude-key.sh",
  "env": {
    "ANTHROPIC_BASE_URL": "https://ai-gateway.company.internal:4000",
    "ANTHROPIC_MODEL": "claude-sonnet-4-6",
    "ANTHROPIC_SMALL_FAST_MODEL": "claude-haiku-4-5",
    "CLAUDE_CODE_API_KEY_HELPER_TTL_MS": "3600000",
    "HTTPS_PROXY": "https://proxy.company.internal:8080"
  }
}

常见问题排查

问题解决方案
401 认证失败检查 ANTHROPIC_AUTH_TOKENapiKeyHelper 脚本返回值
功能降级(无流式/无扩展功能)确认 Gateway 正确透传 anthropic-betaanthropic-version Headers
自定义模型名称不识别设置 ANTHROPIC_MODEL 环境变量匹配 Gateway 中的名称
动态 Key 过期调整 CLAUDE_CODE_API_KEY_HELPER_TTL_MS 值(单位:毫秒)

原文:LLM gateway configuration | 来源:Anthropic 官方文档

相关文章推荐

教程Claude Code 配置完全指南:settings.json 四级作用域与权限管理Claude Code settings.json 四级作用域完整指南:Managed/User/Project/Local 配置范围与优先级规则、权限配置语法(allow/deny/Bash/Read/Write)、三大实际场景配置(个人开发/团队项目/企业安全)、敏感文件保护、环境变量注入与子代理参数配置。2026/3/14教程Claude Code 企业网络配置:代理服务器、自定义 CA 证书与 mTLS 双向认证完整指南Claude Code 企业网络配置完整指南:代理服务器配置(环境变量 HTTPS_PROXY/NO_PROXY + settings.json env 方式)、Basic 认证和 NTLM/Kerberos 替代方案、自定义 CA 证书(NODE_EXTRA_CA_CERTS,PEM 格式要求)、mTLS 双向认证三个环境变量(CLIENT_CERT/CLIENT_KEY/PASSPHRASE)、必须放通的三个域名(api.anthropic.com/claude.ai/platform.claude.com)、完整企业配置 JSON 示例,以及五大故障排查。2026/3/6教程Claude Code MCP 完整使用指南:安装配置主流 MCP 服务器扩展 AI 能力Claude Code MCP(Model Context Protocol)完整使用指南:MCP 是什么(AI 工具扩展标准)、claude mcp 命令管理服务器(add/remove/list)、主流 MCP 服务器安装配置(文件系统/GitHub/PostgreSQL/Brave Search/Slack)、本地 stdio 与远程 SSE 两种连接方式、MCP 服务器安全配置、在 CLAUDE.md 中声明 MCP 工具使用规范,以及自定义 MCP 服务器的快速开发入门。2026/3/18教程Claude Code 输出格式控制完全指南:JSON、流式、结构化输出使用方法Claude Code 和 Claude API 输出格式完整控制指南:--output-format 参数(text/json/stream-json)、非交互模式(-p)的输出控制、结构化 JSON 输出(--json-schema 字段约束)、流式输出(Server-Sent Events)的处理方式、include-partial-messages 流式渐进显示、以及 CI/CD 管道中解析 JSON 输出的实用技巧。2026/3/18教程Claude Code 项目初始化最佳实践:新项目 5 分钟搭建完美 AI 编程环境Claude Code 新项目最佳初始化流程:CLAUDE.md 标准模板(项目背景/技术栈/代码规范/禁止操作)、.claudeignore 初始配置、.claude/commands/ 常用命令预置、settings.json 权限与模型设置、--init 命令的自动化初始化、项目级 vs 全局配置的优先级说明,以及不同类型项目(Web前端/后端API/全栈/开源库)的专项初始化模板。2026/3/18教程Claude Code 权限管理完全指南:精确控制 AI 能执行哪些操作Claude Code 权限系统完整解析:四种权限模式(default/acceptEdits/bypassPermissions/plan)、--allowedTools 和 --disallowedTools 精确工具控制、Bash 命令白名单语法(通配符匹配)、settings.json 持久化权限配置、CLAUDE.md 中的权限规则声明、CI/CD 自动化场景的权限配置、以及如何在效率和安全之间找到平衡点。2026/3/18