实战

Claude Code 接入 Google Vertex AI 完整指南:GCP 凭证、全局端点与模型版本配置

Claude Code 接入 Google Vertex AI 完整指南:Vertex AI API 启用、gcloud 凭证配置、全局端点 vs 区域端点选择、VERTEX_REGION_* 模型区域覆盖变量、模型版本固定、roles/aiplatform.user IAM 配置、1M Token 超长上下文窗口支持,以及配额/404/429 常见错误排查。

2026/3/43分钟 阅读ClaudeEagle

Google Vertex AI 是 GCP 原生的 Claude 部署方案,支持全局端点和区域端点,并为 Claude Sonnet 4/4.6 提供 1M Token 超长上下文窗口。

前提条件

  • GCP 账号,已启用计费
  • 项目中已启用 Vertex AI API
  • 已申请 Claude 模型访问权限(审批可能需要 24-48 小时)
  • 已安装并配置 Google Cloud SDK(gcloud
  • 已在目标区域分配配额

配置步骤

Step 1:启用 Vertex AI API

bash
# 设置项目 ID
gcloud config set project YOUR-PROJECT-ID

# 启用 Vertex AI API
gcloud services enable aiplatform.googleapis.com

Step 2:申请模型访问权限

  1. 打开 Vertex AI Model Garden
  2. 搜索「Claude」模型
  3. 申请所需模型的访问权限
  4. 等待审批(通常 24-48 小时)

Step 3:配置 GCP 凭证

Claude Code 使用标准 Google Cloud 认证,推荐使用应用默认凭证:

bash
# 使用 gcloud 登录(本地开发)
gcloud auth application-default login

# 或在生产环境使用服务账号
export GOOGLE_APPLICATION_CREDENTIALS=/path/to/service-account.json

Step 4:启用 Vertex AI 集成

使用全局端点(推荐):

bash
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID

使用区域端点:

bash
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=us-east5
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID

⚠️ 启用 Vertex AI 后,/login/logout 命令被禁用,认证通过 GCP 凭证处理。

Step 5:全局端点的区域覆盖

使用 CLOUD_ML_REGION=global 时,部分模型可能不支持全局端点。可以为特定模型指定区域:

bash
# 为不支持全局端点的模型单独指定区域
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5

# 可选:为其他模型覆盖区域
export VERTEX_REGION_CLAUDE_3_5_SONNET=us-east5
export VERTEX_REGION_CLAUDE_3_7_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_0_OPUS=europe-west1
export VERTEX_REGION_CLAUDE_4_0_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_1_OPUS=europe-west1

Step 6:固定模型版本

bash
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-6'
export ANTHROPIC_DEFAULT_SONNET_MODEL='claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='claude-haiku-4-5@20251001'

默认模型(不固定时):

模型类型默认值
主模型claude-sonnet-4-6
小型快速模型claude-haiku-4-5@20251001

自定义主模型:

bash
export ANTHROPIC_MODEL='claude-opus-4-6'
export ANTHROPIC_SMALL_FAST_MODEL='claude-haiku-4-5@20251001'

# 需要时禁用 Prompt 缓存
export DISABLE_PROMPT_CACHING=1

IAM 权限配置

最简单的方式:分配 roles/aiplatform.user 角色,该角色包含所有必要权限。

最小自定义角色(只包含必要权限):

json
{
  "includedPermissions": [
    "aiplatform.endpoints.predict"
  ]
}

aiplatform.endpoints.predict 权限用于模型调用和 Token 计数,是唯一必需的权限。

1M Token 超长上下文

Claude Sonnet 4 和 Sonnet 4.6 在 Vertex AI 上支持 1M Token 上下文窗口——是标准 200K 的 5 倍。

适用场景:

  • 超大代码库分析(整个仓库一次性输入)
  • 长文档处理(研究报告、法律合同)
  • 复杂多文件任务(无需分批处理)

常见问题排查

配额问题?

bash
# 在 Cloud Console 查看或申请增加配额
# https://cloud.google.com/docs/quotas/view-manage

404「model not found」错误?

  1. Model Garden 确认模型已启用
  2. 确认你的账号有该区域的访问权限
  3. 如用 CLOUD_ML_REGION=global,在 Model Garden 的「Supported features」确认模型支持全局端点
    • 不支持的模型:用 ANTHROPIC_MODEL 指定,或设置 VERTEX_REGION_<MODEL> 区域端点

429 限流错误?

  • 区域端点:确认主模型和小型快速模型都在所选区域可用
  • 考虑切换到 CLOUD_ML_REGION=global 获得更好可用性

原文:Claude Code on Google Vertex AI | 来源:Anthropic 官方文档

相关文章推荐

实战Claude Code 企业部署完全指南:Teams vs Enterprise、云服务商对比、代理网关与安全策略Claude Code 企业部署完全指南:Teams vs Enterprise 功能对比、Amazon Bedrock/Google Vertex AI/Microsoft Foundry 三大云服务商完整配置代码、企业代理 vs LLM Gateway 使用场景、组织级 CLAUDE.md 多层部署、托管权限安全策略,以及模型版本固定(防云服务商部署失败)和 MCP 团队协作最佳实践。2026/3/4实战Claude Code 企业部署指南:AWS Bedrock、Google Vertex AI 与 Azure 集成方案本文对比 Claude Code 五种企业部署方案(Claude for Teams/Enterprise、Anthropic Console、Amazon Bedrock、Google Vertex AI、Microsoft Azure Foundry),提供各平台的详细配置步骤、企业代理配置、TLS 证书设置以及 LiteLLM 网关集成方案,帮助企业选择最适合自身基础设施的部署路径。2026/2/27实战Claude Code 接入 Microsoft Foundry 完整指南:Azure 资源部署、Entra ID 认证与 RBAC 权限Claude Code 接入 Microsoft Foundry 完整指南:Azure Foundry 资源创建(三个模型部署)、API Key vs Microsoft Entra ID 两种认证方式、CLAUDE_CODE_USE_FOUNDRY 环境变量、模型版本固定(使用部署名称)、Azure RBAC 权限(内置角色 vs 自定义最小权限),以及三大云服务商(Bedrock/Vertex/Foundry)对比表和 LLM Gateway 路由配置。2026/3/4实战Claude Code 接入 Amazon Bedrock 完整指南:IAM 配置、模型版本固定与 AWS GuardrailsClaude Code 接入 Amazon Bedrock 完整指南:五种 AWS 凭证配置方式(CLI/AccessKey/SSO/API Key)、awsAuthRefresh 自动刷新 SSO 凭证、CLAUDE_CODE_USE_BEDROCK 环境变量设置、模型版本固定(防 alias 解析失败)、最小权限 IAM Policy、AWS Guardrails 内容过滤配置,以及区域问题和 on-demand throughput 错误排查。2026/3/4实战Claude Code 命令行工具开发实战:用 AI 快速构建专业 CLI 工具Claude Code 辅助命令行工具(CLI)开发的完整实战指南:Python Click/Typer、Go Cobra、Rust Clap 技术栈选型、用 Claude Code 生成完整 CLI 项目结构(参数解析/子命令/全局选项)、交互式提示和彩色输出、配置文件管理、Shell 自动补全生成、跨平台打包(PyInstaller/goreleaser),以及发布到 PyPI/npm/Homebrew 的完整流程。2026/3/26实战Claude Code Vue 3 实战完全指南:Composition API 开发到企业级前端工程化Claude Code 辅助 Vue 3 开发的完整实战指南:Composition API 组件生成(setup/ref/computed)、Pinia 状态管理代码生成、Vue Router 4 路由配置、TypeScript 类型定义生成(Props/Emits)、Composables 抽象、Vitest 单元测试生成、性能优化(虚拟滚动/v-memo),以及 Options API 迁移和响应式丢失问题排查的 Prompt 模板。2026/3/26