教程

OpenClaw Text-to-Speech 完全指南:ElevenLabs、OpenAI 与免费 Edge TTS 配置

OpenClaw TTS 文字转语音完整配置:ElevenLabs 高质量合成、OpenAI TTS、免费 Edge TTS(无需 API Key)三种服务商对比与配置示例、四种自动触发模式(always/inbound/tagged/off)、Telegram 语音气泡、模型驱动语音指令、长文自动摘要机制。

2026/3/114分钟 阅读ClaudeEagle

OpenClaw 内置 TTS(文字转语音)功能,支持三大服务商,可将 AI 回复自动转为语音消息,在 Telegram 中显示为圆形语音气泡。

三大支持服务商

服务商特点是否需要 API Key
ElevenLabs音质最佳,支持多语言情感合成需要
OpenAI质量优秀,延迟低需要
Edge TTS免费,微软神经网络语音,零成本不需要

如果没有配置任何 API Key,OpenClaw 自动使用 Edge TTS——完全免费,无需注册。

TTS 默认关闭

Auto-TTS 默认不开启。启用方式:

bash
# 当前会话永久开启
/tts always

# 或在配置文件中开启

快速配置

最简配置(启用 + 指定提供商)

json
{
  "messages": {
    "tts": {
      "auto": "always",
      "provider": "elevenlabs"
    }
  }
}

免费版(Edge TTS,无需 API Key)

json
{
  "messages": {
    "tts": {
      "auto": "always",
      "provider": "edge",
      "edge": {
        "enabled": true,
        "voice": "zh-CN-XiaoxiaoNeural",
        "lang": "zh-CN",
        "outputFormat": "audio-24khz-48kbitrate-mono-mp3",
        "rate": "+0%",
        "pitch": "+0%"
      }
    }
  }
}

常用中文语音:

  • zh-CN-XiaoxiaoNeural(女声,温柔)
  • zh-CN-YunxiNeural(男声,沉稳)
  • zh-TW-HsiaoChenNeural(台湾普通话)

ElevenLabs(高质量多语言)

json
{
  "messages": {
    "tts": {
      "auto": "always",
      "provider": "elevenlabs",
      "elevenlabs": {
        "apiKey": "your_elevenlabs_api_key",
        "voiceId": "voice_id",
        "modelId": "eleven_multilingual_v2",
        "voiceSettings": {
          "stability": 0.5,
          "similarityBoost": 0.75,
          "style": 0.0,
          "useSpeakerBoost": true,
          "speed": 1.0
        }
      }
    }
  }
}

OpenAI 主供 + ElevenLabs 备份

json
{
  "messages": {
    "tts": {
      "auto": "always",
      "provider": "openai",
      "summaryModel": "openai/gpt-4.1-mini",
      "openai": {
        "apiKey": "your_openai_api_key",
        "model": "gpt-4o-mini-tts",
        "voice": "alloy"
      },
      "elevenlabs": {
        "apiKey": "your_elevenlabs_api_key",
        "voiceId": "voice_id"
      }
    }
  }
}

四种自动 TTS 模式

模式触发条件
off禁用(默认)
always所有回复都转语音
inbound仅当收到语音消息后才回语音
tagged仅当回复含 [[tts]] 标签时
bash
/tts always    # 始终语音
/tts inbound   # 语音对语音
/tts tagged    # 按标签触发
/tts off       # 关闭
/tts status    # 查看当前状态

斜杠命令完整参考

bash
/tts off
/tts always
/tts inbound
/tts tagged
/tts status
/tts provider openai        # 切换提供商
/tts limit 2000             # 设置摘要阈值(字符数)
/tts summary off            # 关闭长文自动摘要
/tts audio Hello from AI   # 生成一次性语音(不影响设置)

Discord 注意:/tts 是 Discord 内置命令,OpenClaw 在 Discord 使用 /voice 作为替代。

模型驱动的语音指令

AI 可以在回复中嵌入 TTS 指令,动态控制语音效果:

这是你要的内容。 [[tts:voiceId=pMsXgVXv3BLzUgSXRplE model=eleven_v3 speed=1.1]] [[tts:text]](笑声) 再读一遍吧。[[/tts:text]]

可用指令键:voiceIdmodelstabilitysimilarityBooststylespeedlanguageCodeseed

禁用模型控制(更严格的设置):

json
{
  "messages": {
    "tts": {
      "modelOverrides": { "enabled": false }
    }
  }
}

长文自动摘要

回复超过阈值(默认 1500 字符)时,OpenClaw 先用语言模型摘要,再转语音:

json
{
  "messages": {
    "tts": {
      "summaryModel": "openai/gpt-4.1-mini"
    }
  }
}

Telegram 输出格式

  • Telegram:Opus 语音气泡(48kHz/64kbps)→ 显示为圆形语音泡
  • 其他频道:MP3(44.1kHz/128kbps)
  • Edge TTS:使用 edge.outputFormat 配置(默认 MP3)

TTS 处理流程

收到回复 → TTS 开启? 否 → 发送文本 是 → 含媒体/MEDIA:/超短? 是 → 发送文本 否 → 超过字数限制? 否 → TTS → 附加音频 是 → 摘要开启? 否 → 发送文本 是 → 摘要 → TTS → 附加音频

原文:Text-to-Speech - OpenClaw | 来源:OpenClaw 官方文档

相关文章推荐

教程OpenClaw Talk Mode 语音对话完全指南:用说话代替打字的 AI 交互新方式OpenClaw Talk Mode(语音对话模式)完整教程:Talk Mode 的工作原理(语音输入转文字 + AI 处理 + TTS 语音输出的完整链路)、在 iOS/Android/macOS 节点上启用 Talk Mode 的配置步骤、语音唤醒词(Voice Wake)设置、TTS 语音引擎选择(ElevenLabs/系统TTS)、语音对话的延迟优化、配合 Node 摄像头的多模态语音交互,以及 Talk Mode 与 Voice Wake 的组合使用场景(免手持语音助手/车载助手/烹饪助手)。2026/3/23教程OpenClaw Skills 开发完全指南:从零编写高质量 SKILL.md 自定义技能文件OpenClaw Skills 开发完整教程:SKILL.md 文件结构详解、自动触发 vs 显式触发原理、三个实战模板(GitHub 仓库管理/每日信息简报/代码健康检查)、让技能精准自动触发的描述写法,以及技能质量标准和 clawhub.ai 使用方法。2026/4/19教程OpenClaw 零基础完全入门:安装、Telegram 配置、记忆系统和技能插件完整指南OpenClaw 从零开始完整教程:用宠物龙虾类比理解架构、npm 安装步骤、Telegram Bot 配置、SOUL.md 性格定义、三层记忆系统(每日日志/长期记忆/MEMORY.md)、HEARTBEAT.md 主动任务、技能安装,以及安全配置和常见问题解决。2026/4/18教程OpenClaw 快速入门:用 Telegram 控制 AI Agent,5 分钟搭建个人 AI 助理OpenClaw 5 分钟快速入门:用 Telegram 控制 AI Agent,含安装配置、Bot 创建、Skills 定义、多渠道支持、Claude Code 编程任务集成,以及与 Claude Code CLI 的区别和互补关系。2026/4/13教程OpenClaw 多 Agent 架构入门:用 Telegram Bot 控制你的 AI Agent 集群OpenClaw 多 Agent 架构入门指南:通过 Telegram 控制 AI Agent 集群,支持子 Agent 编排、MCP 集成和多节点部署。含快速开始教程。2026/4/7教程OpenClaw Background Tasks 完全指南:让 AI 在后台自主执行长时间任务(2026)OpenClaw Background Tasks(后台任务)完整指南:Background Tasks 与普通对话的区别(异步执行/不阻塞渠道/可中断恢复)、通过自然语言触发后台任务(「帮我在后台处理...」)、openclaw tasks 命令行管理(list/show/cancel/logs)、任务状态跟踪与完成通知、长时间任务的最佳实践(分批处理/超时设置/错误恢复)、与 Cron Jobs 的区别和选用场景,以及实战案例(批量文件处理/代码库扫描/数据报告生成)。2026/4/2