Hermes Agent 本身免费,但运行它的成本因为配置差异变化很大——从每月几乎免费到每月几百元不等。这篇文章给你一个清晰的成本全貌。
费用由哪几部分组成
- LLM API 费用(最大变量)
- 服务器/托管费用(可选)
- Honcho 用户建模(可选,有免费额度)
LLM API 费用:主要成本
选项 A:Nous Portal(400+ 模型,统一入口)
hermes login # OAuth 登录,无需手动填 API KeyNous Portal 是 Hermes 官方托管的模型门户,400+ 个模型通过一个入口访问,计费按实际 token 用量。
适合:想用 Hermes 自家模型的用户,或者需要切换多种模型的场景。
选项 B:OpenRouter(200+ 模型,支持免费模型)
最灵活的选择。在 openrouter.ai 注册获取 API Key。
免费模型(加 :free 后缀,有速率限制):
meta-llama/llama-4-scout:freegoogle/gemini-2.0-flash-exp:free
付费模型参考价(2026 年 4 月):
| 模型 | 输入(/百万 token) | 输出(/百万 token) |
|---|---|---|
| Claude Haiku 4.5 | ~$0.80 | ~$4 |
| Claude Sonnet 4.5 | ~$3 | ~$15 |
| GPT-4o | ~$2.5 | ~$10 |
| DeepSeek V3 | ~$0.14 | ~$0.28 |
选项 C:本地 Ollama(完全免费)
ollama pull llama3.3
# config.yaml 里配置 Custom Endpoint: http://localhost:11434/v1零 API 费用,但性能取决于本地硬件,复杂 Agent 任务(多步推理、工具调用链)明显弱于 Claude/GPT-4。
真实月费估算
| 使用场景 | 模型选择 | 月费估算 |
|---|---|---|
| 偶尔使用(每天 5-10 次对话) | Haiku via OpenRouter | ¥15-40 |
| 日常开发助手(每天 20-50 次对话) | Sonnet via OpenRouter | ¥80-200 |
| 重度使用 + Cron 定时任务 | Sonnet + 部分 Opus | ¥200-500 |
| 本地模型(M2 MacBook/好一点的显卡) | Ollama 本地 | ¥0(电费忽略不计) |
| 免费额度 | OpenRouter 免费模型 | ¥0(有限速) |
省钱的关键:分级用模型——简单任务(搜索、格式化、总结)用 Haiku,需要深度推理的任务才用 Sonnet/Opus。
# 会话内快速切换
/model anthropic/claude-haiku-4-5 # 简单任务
/model anthropic/claude-sonnet-4-5 # 复杂任务
托管/服务器费用
Hermes 可以跑在:
| 方式 | 月费 | 适合 |
|---|---|---|
| 本地电脑(一直开着) | ¥0(电费) | 不需要随时可访问 |
| VPS(Hetzner/DigitalOcean) | ¥30-70 | 24/7 在线,推荐 |
| Mac Mini 专用机 | 一次性买断 | 本地 24/7 + 能跑本地模型 |
| Serverless(Modal/Daytona) | 按用量 | 空闲免费,按需付费 |
推荐配置:¥35/月 VPS + OpenRouter Haiku = 大约 ¥50-100/月 的完整 24/7 AI Agent。
硬件选择
只想用云端 LLM(API 方式)
最低要求:2 核 2GB 内存 的 VPS 就够。Hermes 本身不需要太多资源,耗资源的是 LLM API 调用(在对方服务器上算)。
想跑本地模型(用 Ollama)
| 硬件 | 能跑的模型 | 推荐场景 |
|---|---|---|
| Mac Mini M4(16GB 统一内存) | llama3.3、qwen2.5-coder:14b | 日常开发,速度流畅 |
| Mac Mini M4 Pro(24GB) | qwen2.5-coder:32b | 更强代码能力 |
| RTX 4090(24GB VRAM) | qwen2.5-coder:32b、llama3.3:70b | 最高性能 |
| 仅 CPU(16GB RAM) | phi3.5、llama3.2:3b | 可用但慢,不推荐 |
推荐给大多数人的配置
入门:¥35/月 VPS + OpenRouter Haiku,随用随开,低 token 消耗的任务非常便宜。
进阶:Mac Mini M4(16GB)+ Ollama 跑本地模型,一次性投入,之后近乎免费。复杂任务用 API,日常任务用本地模型。
Honcho 用户建模费用
Honcho 是 Hermes 的深度用户建模服务,对长期使用效果影响很大。
- 免费额度:够个人用户正常使用
- 付费方案:按 API 调用量计费,日常使用通常在几美元/月
hermes memory setup # 配置时选择 honcho从 honcho.dev 获取 API Key。
Honcho 值得开吗?
值得,如果你:
- 计划长期(一个月以上)使用 Hermes
- 有重复性任务(相同类型的 debug、相同类型的文档编写)
- 希望 Agent 越来越了解你的风格和偏好
不值得,如果你:
- 只是短期试用
- 每次任务都完全不同,没有重复模式
- 对隐私很敏感(Honcho 是第三方服务)
总结:哪种组合最适合你
| 用户类型 | 推荐配置 | 月费 |
|---|---|---|
| 技术探索者 | 本地 + OpenRouter 免费模型 | ¥0 |
| 个人开发者 | VPS + Haiku/Sonnet | ¥50-150 |
| 重度用户 | Mac Mini + Ollama 本地 + API 补充 | 一次性硬件 + ¥30-80 |
| 团队使用 | 服务器 + Sonnet + Honcho | ¥200-500+ |
来源:virtualuncle.com Hermes 完整指南 | aarongxa.com 使用技巧 | 整理:ClaudeEagle