教程

Hermes Agent 免费使用指南:Ollama 本地部署和 OpenRouter 零成本方案

Hermes Agent 免费和低成本使用完整指南:本地 Ollama 零费用配置、OpenRouter 免费模型、付费用量控制策略,以及 VPS 24 小时部署方案,含省 token 技巧和实际月费参考。

2026/4/133分钟 阅读ClaudeEagle

Hermes Agent 本身 MIT 开源免费,成本在于 LLM API。好消息:有几条路可以把成本降到零或极低。


三种策略对比

策略月成本性能适合
本地 Ollama0 元取决于硬件隐私优先、无 API 预算
OpenRouter 免费模型0 元中等想免费用强模型
OpenRouter 付费限额35-140 元最强日常使用

方案 1:本地 Ollama(完全免费)

所有计算在本地,零 API 费,数据不出本地。

bash
# 安装 Ollama
curl -fsSL https://ollama.ai/install.sh | sh   # Linux
brew install ollama                             # macOS

# 拉取模型
ollama pull llama3.3           # 均衡(8GB 显存)
ollama pull qwen2.5-coder:14b  # 代码能力强(12GB 显存)
ollama pull phi3.5             # CPU 友好小模型

配置 Hermes:

bash
hermes model
# 选 Custom Endpoint
# Base URL: http://localhost:11434/v1
# API Key: ollama(随便填)
# Model: llama3.3

硬件参考

硬件推荐模型速度
M2 MacBook 16GB 统一内存llama3.325-40 tok/s
RTX 4090 24GBqwen2.5-coder:32b30-50 tok/s
仅 CPUphi3.55-10 tok/s

注意:本地模型工具调用和多步推理弱于 Claude/GPT-4。复杂 Agent 任务建议用付费模型。


方案 2:OpenRouter 免费模型

OpenRouter 上有免费高质量模型(加 :free 后缀):

bash
hermes model  # 选 OpenRouter,粘贴 API Key
yaml
# config.yaml
provider:
  type: openrouter
  api_key: OPENROUTER_KEY
  model: meta-llama/llama-4-scout:free

常用免费模型:

  • meta-llama/llama-4-scout:free
  • google/gemini-2.0-flash-exp:free
  • mistralai/mistral-7b-instruct:free

限制:免费模型有速率限制(10-20 req/min),并行任务会触发限流。


方案 3:付费 OpenRouter + 月度限额(推荐)

openrouter.ai 设置月度预算上限(如 $10),超额后 API 返回 429,Hermes 停止调用。

实际费用参考(2026 年):

  • Claude Haiku:约 $0.80/百万 token
  • 日常使用(每天 10-20 次对话):约 $3-8/月

模型分级策略(省钱关键):

bash
/model anthropic/claude-haiku-4-5   # 日常搜索、简单问答
/model anthropic/claude-sonnet-4-5  # 代码、复杂分析

凭证池:多账号免费额度叠加

v0.7.0 的新功能:

yaml
providers:
  openrouter:
    credentials:
      - api_key: OPENROUTER_KEY_1
      - api_key: OPENROUTER_KEY_2
    rotation: least_used  # 均衡分配,任一限速自动切换

两个免费账号各有独立配额,总免费额度翻倍。


省 Token 技巧

技巧 1:/compress 长会话定期压缩,减少历史 token 消耗:

bash
/compress  # 会话内输入

技巧 2:利用自学习技能 重复任务有技能后,消耗减少 50-70%(跳过探索阶段,直接执行)。

技巧 3:Dispatch 模式 批量任务用命令行 dispatch,比交互式省 token:

bash
hermes dispatch "扫描 src/ 找出所有 console.log,输出文件列表"

在 VPS 上 24 小时部署

每月约 35-70 元 VPS + API 费:

bash
# Ubuntu 22.04 VPS 上安装
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
hermes model  # 配置 OpenRouter
hermes gateway telegram --token BOT_TOKEN

systemd 守护进程:

ini
[Unit]
Description=Hermes Agent Gateway
After=network.target

[Service]
User=ubuntu
ExecStart=/home/ubuntu/.hermes/bin/hermes gateway start
Restart=always
RestartSec=10

[Install]
WantedBy=multi-user.target
bash
sudo systemctl enable --now hermes-gateway

24 小时在线 AI Agent,手机随时控制。


来源:onedollarvps.com 指南 | byteiota.com 教程 | 整理:ClaudeEagle

相关文章推荐

教程OpenClaw 模型提供商完全指南:从 Anthropic 到 Ollama 本地模型的配置方法OpenClaw 20+ 模型提供商配置完全指南:Anthropic(API Key + OAuth)、OpenAI、OpenRouter 统一接口、Ollama 本地离线模型、Venice AI 隐私推荐、Amazon Bedrock、LiteLLM 统一网关,以及模型故障转移和 per-Agent 模型配置。2026/3/2教程Hermes Agent 安装配置教程:从零到 Telegram 控制 AI Agent,含 Docker 沙箱Hermes Agent 完整安装配置教程:一键安装、OpenRouter/Anthropic/Ollama 提供商选择、Telegram Bot 配置、Docker 沙箱部署、MCP 工具接入和社区技能安装,含常见报错解决方案。2026/4/13教程OpenClaw 多模型配置指南:同一助手灵活切换 Claude、GPT-4o 和 GeminiOpenClaw 多模型配置完整教程:支持的 AI 提供商(Anthropic/OpenAI/Google/Ollama/AWS Bedrock)、config.json 配置方式、按会话切换模型、按任务路由模型、本地 Ollama 私有化部署,以及不同模型的成本和能力对比选择策略。2026/3/15教程OpenClaw 快速入门:用 Telegram 控制 AI Agent,5 分钟搭建个人 AI 助理OpenClaw 5 分钟快速入门:用 Telegram 控制 AI Agent,含安装配置、Bot 创建、Skills 定义、多渠道支持、Claude Code 编程任务集成,以及与 Claude Code CLI 的区别和互补关系。2026/4/13教程Claude Code 高级提示技巧:TDD 驱动、截图验证、面试需求、让 AI 自我检查 7 个方法Claude Code 高级提示技巧 7 个方法:TDD 先写测试、截图验证 UI、面试确认需求、新会话 Reviewer 自检、参考现有模式、可中断大型任务、三阶段探索-计划-执行工作流。2026/4/13教程Claude Code Remote Control 详解:用手机或另一台电脑控制本地 AI 编程会话Claude Code Remote Control 完整指南:3 种启动方式(Server/交互/现有会话)、手机扫码连接步骤、实际使用场景,以及与网页版的核心区别、安全机制和常见报错解决方法。2026/4/13