用了 Hermes Agent 一段时间?这篇文章专门讲那些文档里不会重点说、但日常使用差距巨大的技巧——从上下文管理、斜杠命令、子 Agent 并行,到本地项目配置文件,全部来自真实使用经验。
技巧 1:用 CONTEXT.md 让 Agent 自动了解项目
在项目根目录放一个 CONTEXT.md 或 .hermescontext 文件,Agent 每次对话开始时自动读取,不需要手动解释项目背景:
# MyProject 项目上下文
## 技术栈
- 后端:Go 1.25 + Gin + Ent ORM
- 前端:Vue 3 + Vite + TailwindCSS
- 数据库:PostgreSQL 15
## 开发约定
- 使用 uv 而不是 pip(如果用 Python 脚本)
- 提交信息遵循 Conventional Commits
- API handler 放在 internal/handler/,不写在路由里
## 常用命令
- 运行:make dev
- 测试:make test
- 部署:make deploy ENV=staging对比每次都要解释项目背景,节省的解释时间和 token 非常可观。
技巧 2:主动触发技能记忆
Hermes 会在复杂任务后自动生成技能,但也可以手动触发:
把刚才解决这个 CORS 问题的方法保存为技能,
命名为 cors-debugging,下次遇到类似问题可以直接用或者让 Agent 把整个工作流保存下来:
把今天的代码审查工作流保存为技能,
包括检查项清单和我偏好的反馈格式每次明确要求保存,比等 Agent 自动判断更可靠。
技巧 3:/compress 主动压缩上下文
长会话的 token 消耗随对话增长。一个 1 小时的深度 debug 会话可能已经用了 50k+ tokens,后续每条消息都要携带这些历史。
解决方案:任务切换或阶段切换时主动压缩:
/compress
Agent 会把当前对话总结成一段摘要继续,保留关键上下文,去掉冗余的中间步骤输出。
建议触发时机:
- 完成一个独立子任务后
- 上下文超过 30k tokens 时(/usage 可以查看)
- 从 debug 切换到新功能开发时
技巧 4:用 /retry 和 /undo 快速纠偏
模型给出不满意的回复?直接重新生成,不要费心解释哪里不好:
/retry
Agent 走了错误方向?回滚到上一步:
/undo
对比发一大段纠正消息,/retry 和 /undo 更快,也不会增加上下文负担。
技巧 5:子 Agent 并行处理多任务
有多个独立任务时,不要串行等待,让 Agent 并发执行:
同时做这三件事:
1. 搜索最近一周 Claude Code 的更新动态
2. 检查我们的 GitHub 仓库有哪些 open issue
3. 分析 src/api/ 目录的代码质量
各自独立执行,完成后汇总结果每个子 Agent 有独立的对话历史和工具集,只把最终摘要传回主上下文。对比串行执行可以节省 2-3 倍时间。
技巧 6:用 execute_code 工具批量处理
让 Agent 写 Python 脚本来处理需要重复操作的任务,比逐条让 Agent 处理效率高很多:
写一个 Python 脚本,读取 data/ 目录下所有 CSV 文件,
统计每列的空值比例,超过 10% 的列输出警告,
生成一份汇总报告到 report.md一次工具调用,处理 100 个文件,消耗的 token 和处理 1 个文件差不多。
技巧 7:设置个性化风格
默认的 Hermes 回复比较详细,喜欢简洁的可以调整:
/personality concise
或者在 ~/.hermes/config.yaml 里设置默认风格:
agent:
personality: concise # 简洁模式
# personality: thorough # 详细模式(默认)
# personality: casual # 轻松随意也可以完全自定义:
/personality 直接给答案,不要解释,代码直接展示,不要描述步骤
技巧 8:Telegram 私聊主题功能(v0.5.0+)
v0.5.0 支持 Telegram Private Chat Topics,在一个 Telegram 对话里创建不同的项目话题:
#工作项目→ 绑定工作相关技能#个人脚本→ 绑定个人自动化技能#学习笔记→ 绑定学习相关工作流
每个话题有独立的会话历史和技能绑定,不互相干扰。适合有多个项目的用户。
技巧 9:/insights 追踪使用情况
了解自己怎么用 Agent 才能优化使用效率:
/usage # 当前会话 token 消耗
/insights # 历史使用统计
/insights --days 7 # 最近 7 天详情
看哪类任务消耗 token 最多,针对性地优化(加技能、改 prompt、用更便宜的模型)。
技巧 10:hermes doctor 诊断所有问题
任何奇怪的问题先跑 hermes doctor:
hermes doctor输出每项配置的检查结果,有问题的标红。覆盖:LLM 连接、工具可用性、网关状态、内存配置、依赖版本。
比自己 debug 快很多,是遇到问题的第一步。
技巧 11:使用语音备忘录(移动端)
在 Telegram/WhatsApp 里发语音消息,Hermes 自动转文字处理:
- 发语音 → 自动转文字 → Agent 按文字内容执行
- 支持 Whisper(本地)和 OpenAI Whisper(云端)
适合移动端快速派任务,不需要打字。
技巧 12:给 cron 任务加时间守卫
定时任务在补跑(电脑重启后追跑漏掉的任务)时可能在不合适的时间执行,在 prompt 里加守卫:
每天早上 9 点检查 GitHub 通知并发 Telegram 摘要。
如果当前时间不在 8:00-10:00 之间,跳过执行并记录「补跑时间不合适,已跳过」技巧 13:API 密钥优先级
Hermes 的 API 密钥读取顺序:
环境变量 (.env) > config.yaml
如果某个设置没有生效,检查两个地方是否有冲突。
cat ~/.hermes/.env # 检查 .env
cat ~/.hermes/config.yaml # 检查 config.yaml
hermes config get # 查看当前生效的配置技巧 14:中断任务不要用 Ctrl+C
Agent 在执行长任务时,发送新消息可以中断当前任务:
停,先别做了,我想换个方向或者使用:
/stop
Ctrl+C 会中断整个进程。发消息中断任务更干净,Agent 会优雅地停止。
技巧 15:开启 Honcho 用户建模
这是最容易被忽略的重要功能:Honcho 深度用户建模,默认是关闭的。
hermes memory setup
# 在交互向导里选择 honcho或者直接在 config.yaml 里配置:
memory:
provider: honcho
honcho:
api_key: YOUR_HONCHO_KEY
profile_scope: true开启后,Hermes 会随时间建立对你的深度理解:沟通风格、决策模式、技术偏好、工作习惯。这是「越用越聪明」的核心机制,不开就等于关掉了最重要的自学习功能。
斜杠命令速查表
| 命令 | 作用 |
|---|---|
/new 或 /reset | 开始新对话 |
/model [model] | 切换模型 |
/personality [style] | 设置个性风格 |
/retry | 重新生成上一条回复 |
/undo | 回滚上一步 |
/compress | 压缩上下文 |
/usage | 查看 token 消耗 |
/insights [--days N] | 使用统计 |
/skills | 浏览技能库 |
/stop | 中断当前任务 |
/save | 保存会话 |
来源:aarongxa.com Hermes 实战指南 | hermes-agent.nousresearch.com 官方文档 | 整理:ClaudeEagle