教程

Hermes Agent 免费使用指南:Ollama 本地部署和 OpenRouter 零成本方案

Hermes Agent 免费和低成本使用完整指南:本地 Ollama 零费用配置、OpenRouter 免费模型、付费用量控制策略,以及 VPS 24 小时部署方案,含省 token 技巧和实际月费参考。

2026/4/133分钟 阅读ClaudeEagle

Hermes Agent 本身 MIT 开源免费,成本在于 LLM API。好消息:有几条路可以把成本降到零或极低。


三种策略对比

策略月成本性能适合
本地 Ollama0 元取决于硬件隐私优先、无 API 预算
OpenRouter 免费模型0 元中等想免费用强模型
OpenRouter 付费限额35-140 元最强日常使用

方案 1:本地 Ollama(完全免费)

所有计算在本地,零 API 费,数据不出本地。

bash
# 安装 Ollama
curl -fsSL https://ollama.ai/install.sh | sh   # Linux
brew install ollama                             # macOS

# 拉取模型
ollama pull llama3.3           # 均衡(8GB 显存)
ollama pull qwen2.5-coder:14b  # 代码能力强(12GB 显存)
ollama pull phi3.5             # CPU 友好小模型

配置 Hermes:

bash
hermes model
# 选 Custom Endpoint
# Base URL: http://localhost:11434/v1
# API Key: ollama(随便填)
# Model: llama3.3

硬件参考

硬件推荐模型速度
M2 MacBook 16GB 统一内存llama3.325-40 tok/s
RTX 4090 24GBqwen2.5-coder:32b30-50 tok/s
仅 CPUphi3.55-10 tok/s

注意:本地模型工具调用和多步推理弱于 Claude/GPT-4。复杂 Agent 任务建议用付费模型。


方案 2:OpenRouter 免费模型

OpenRouter 上有免费高质量模型(加 :free 后缀):

bash
hermes model  # 选 OpenRouter,粘贴 API Key
yaml
# config.yaml
provider:
  type: openrouter
  api_key: OPENROUTER_KEY
  model: meta-llama/llama-4-scout:free

常用免费模型:

  • meta-llama/llama-4-scout:free
  • google/gemini-2.0-flash-exp:free
  • mistralai/mistral-7b-instruct:free

限制:免费模型有速率限制(10-20 req/min),并行任务会触发限流。


方案 3:付费 OpenRouter + 月度限额(推荐)

openrouter.ai 设置月度预算上限(如 $10),超额后 API 返回 429,Hermes 停止调用。

实际费用参考(2026 年):

  • Claude Haiku:约 $0.80/百万 token
  • 日常使用(每天 10-20 次对话):约 $3-8/月

模型分级策略(省钱关键):

bash
/model anthropic/claude-haiku-4-5   # 日常搜索、简单问答
/model anthropic/claude-sonnet-4-5  # 代码、复杂分析

凭证池:多账号免费额度叠加

v0.7.0 的新功能:

yaml
providers:
  openrouter:
    credentials:
      - api_key: OPENROUTER_KEY_1
      - api_key: OPENROUTER_KEY_2
    rotation: least_used  # 均衡分配,任一限速自动切换

两个免费账号各有独立配额,总免费额度翻倍。


省 Token 技巧

技巧 1:/compress 长会话定期压缩,减少历史 token 消耗:

bash
/compress  # 会话内输入

技巧 2:利用自学习技能 重复任务有技能后,消耗减少 50-70%(跳过探索阶段,直接执行)。

技巧 3:Dispatch 模式 批量任务用命令行 dispatch,比交互式省 token:

bash
hermes dispatch "扫描 src/ 找出所有 console.log,输出文件列表"

在 VPS 上 24 小时部署

每月约 35-70 元 VPS + API 费:

bash
# Ubuntu 22.04 VPS 上安装
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes model  # 配置 OpenRouter
hermes gateway telegram --token BOT_TOKEN

systemd 守护进程:

ini
[Unit]
Description=Hermes Agent Gateway
After=network.target

[Service]
User=ubuntu
ExecStart=/home/ubuntu/.hermes/bin/hermes gateway start
Restart=always
RestartSec=10

[Install]
WantedBy=multi-user.target
bash
sudo systemctl enable --now hermes-gateway

24 小时在线 AI Agent,手机随时控制。


来源:onedollarvps.com 指南 | byteiota.com 教程 | 整理:ClaudeEagle

相关文章推荐

教程Hermes Agent 真实费用详解:API 成本、服务器托管和硬件选择完全指南Hermes Agent 完整费用指南:Nous Portal/OpenRouter/Ollama 三种 LLM 方案成本对比、真实月费估算表(从 0 到 500 元)、VPS 和 Mac Mini 托管方案、Honcho 是否值得开,帮你选到最省钱的配置。2026/4/15教程Hermes Agent 六种安装路径详解:VPS、Mac、WSL2、Docker、Pinokio、ServerlessHermes Agent 六种安装方式完整指南:VPS 一键部署(推荐)、Mac 本地 + Ollama、Windows WSL2、Docker Compose、Pinokio 无命令行、Modal/Daytona Serverless,含从 OpenClaw 迁移方法和常见报错解决。2026/4/15教程OpenClaw 模型提供商完全指南:从 Anthropic 到 Ollama 本地模型的配置方法OpenClaw 20+ 模型提供商配置完全指南:Anthropic(API Key + OAuth)、OpenAI、OpenRouter 统一接口、Ollama 本地离线模型、Venice AI 隐私推荐、Amazon Bedrock、LiteLLM 统一网关,以及模型故障转移和 per-Agent 模型配置。2026/3/2教程Hermes Agent MCP 集成完全指南:GitHub、数据库、内部 API 连接实战Hermes Agent MCP 集成完整教程:常用 MCP Server 安装配置(GitHub/PostgreSQL/Slack),v0.8.0 新增 OAuth 2.1 PKCE 安全认证和 OSV 漏洞扫描,GitHub 完整操作和数据库查询实战示例,以及自己开发 MCP Server 的快速入门。2026/4/16教程Hermes Agent 消息网关配置完整指南:Telegram、Discord、Slack 多平台同步Hermes Agent 消息网关全面配置教程:Telegram Bot 创建和私聊话题分区、Discord Bot 权限配置、Slack App 设置、多平台同步原理、工具权限按平台管控、安全白名单配置,含常见连接问题排查。2026/4/15教程Hermes Agent Cron 定时任务完全指南:10 个开箱即用的 AI 自动化任务模板Hermes Agent 定时任务完整教程:自然语言配置 Cron、10 个实用任务模板(AI 资讯简报/GitHub 监控/代码扫描/服务器告警/周报生成等)、标准 Cron 表达式参考和时间守卫防异常补跑。2026/4/15