教程

OpenClaw 图像生成完全指南:在聊天中直接让 AI 生成图片(2026)

OpenClaw 图像生成(image_generate 工具)完整指南:支持的图像生成提供商(DALL-E 3/Stable Diffusion/Flux/Ideogram)、配置 API Key、通过自然语言对话生成图片(尺寸/风格/质量参数)、图像编辑功能(局部修改/风格迁移)、各提供商能力对比(生成质量/速度/价格/中文提示词支持)、在 Telegram/Discord 中直接发图、批量生成图片,以及常见问题(图片无法发送/API限额/中文提示词乱码)排查。

2026/4/24分钟 阅读ClaudeEagle

OpenClaw 的 image_generate 工具让你在任意聊天渠道 (Telegram、Discord、WhatsApp 等)直接生成 AI 图片—— 对话中说「帮我画一张...」,AI 立即生成并发回。

支持的图像生成提供商

提供商模型特点价格参考
OpenAI DALL-E 3dall-e-3质量高,中文提示词友好$0.04/张(标准)
OpenAI DALL-E 2dall-e-2速度快,价格低$0.018/张
Stability AIstable-diffusion-xl风格多样,可本地部署$0.002/张
Black Forest Labsflux-pro / flux-dev最新架构,质量极高$0.055/张(Pro)
Ideogramideogram-v2文字渲染出色$0.08/张
Together AIFLUX.1-schnell极速,适合批量生成$0.003/张

快速配置

DALL-E 配置(最简单)

json
{
  "providers": {
    "openai": {
      "apiKey": "${OPENAI_API_KEY}"
    }
  },
  "tools": {
    "imageGenerate": {
      "enabled": true,
      "defaultProvider": "openai",
      "defaultModel": "dall-e-3"
    }
  }
}

Flux 配置(质量最高)

json
{
  "providers": {
    "bfl": {
      "apiKey": "${BFL_API_KEY}"
    }
  },
  "tools": {
    "imageGenerate": {
      "enabled": true,
      "defaultProvider": "bfl",
      "defaultModel": "flux-pro"
    }
  }
}

多提供商配置(按需切换)

json
{
  "tools": {
    "imageGenerate": {
      "enabled": true,
      "defaultProvider": "openai",
      "providers": {
        "openai": { "model": "dall-e-3" },
        "bfl": { "model": "flux-pro" },
        "together": { "model": "black-forest-labs/FLUX.1-schnell" }
      }
    }
  }
}

基本使用

在任意渠道直接对话:

你:帮我画一张赛博朋克风格的上海夜景 AI:[调用 image_generate 工具] [生成图片并发送到聊天] 这是生成的赛博朋克上海夜景!

指定参数

你:画一张 16:9 的山水画, 中国水墨风格,高质量, 有瀑布和远山 # 也可以指定提供商 你:用 Flux Pro 帮我生成一张产品宣传图, 白色背景,简约风格,主题是智能手表

图像尺寸控制

支持的尺寸(DALL-E 3): 正方形:1024x1024 横向:1792x1024 竖向:1024x1792 Flux 支持更灵活的尺寸设置: 宽高比:1:1、16:9、9:16、4:3 等

图像编辑功能

部分提供商支持对已有图片进行修改:

你:[发送一张照片] 帮我把这张图的背景换成大海, 保持人物不变 AI(使用图像编辑功能): [分析原图] [生成修改后的版本] [发送回来]

支持的编辑操作:

  • 背景替换
  • 风格迁移(变成油画/水彩/素描风格)
  • 局部修改(inpainting)
  • 图像放大(upscaling)

各提供商能力对比

维度DALL-E 3Flux ProSD XL
中文提示词✅ 优秀⚠️ 一般⚠️ 一般
图像质量⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
生成速度10-20s15-30s5-15s
图像编辑
文字渲染⚠️ 一般⚠️ 一般
价格较高

推荐组合

  • 日常使用:DALL-E 3(中文友好,质量稳定)
  • 高质量创作:Flux Pro(最新架构,细节丰富)
  • 大量快速生成:Together AI FLUX.1-schnell(极速低价)

配置默认行为

json
{
  "tools": {
    "imageGenerate": {
      "enabled": true,
      "defaultSize": "1024x1024",
      "defaultQuality": "standard",
      "defaultStyle": "natural",
      "sendInline": true,
      "addCaption": true
    }
  }
}

sendInline: true:图片直接发到对话中(不是链接) addCaption: true:图片下方附上生成的提示词

常见问题排查

图片发不出去(Telegram/WhatsApp)

检查渠道对图片大小的限制 Telegram:最大 10MB,超出自动压缩 WhatsApp:最大 5MB → 配置 imageGenerate.maxSizeMb 限制生成大小

中文提示词生成效果差

DALL-E 3 支持中文提示词,其他模型建议翻译为英文 → 开启自动翻译: "tools": { "imageGenerate": { "autoTranslatePrompt": true } }

API 限额提示

DALL-E 3:每分钟 5 张(Tier 1),消费后提升 Flux Pro:按量计费,无硬性频率限制 → 配置备用提供商:当主提供商限额时自动切换

来源:OpenClaw 官方文档 - docs.openclaw.ai/tools/image-generation

相关文章推荐

教程OpenClaw Skills 开发完全指南:从零编写高质量 SKILL.md 自定义技能文件OpenClaw Skills 开发完整教程:SKILL.md 文件结构详解、自动触发 vs 显式触发原理、三个实战模板(GitHub 仓库管理/每日信息简报/代码健康检查)、让技能精准自动触发的描述写法,以及技能质量标准和 clawhub.ai 使用方法。2026/4/19教程OpenClaw 零基础完全入门:安装、Telegram 配置、记忆系统和技能插件完整指南OpenClaw 从零开始完整教程:用宠物龙虾类比理解架构、npm 安装步骤、Telegram Bot 配置、SOUL.md 性格定义、三层记忆系统(每日日志/长期记忆/MEMORY.md)、HEARTBEAT.md 主动任务、技能安装,以及安全配置和常见问题解决。2026/4/18教程OpenClaw 快速入门:用 Telegram 控制 AI Agent,5 分钟搭建个人 AI 助理OpenClaw 5 分钟快速入门:用 Telegram 控制 AI Agent,含安装配置、Bot 创建、Skills 定义、多渠道支持、Claude Code 编程任务集成,以及与 Claude Code CLI 的区别和互补关系。2026/4/13教程OpenClaw 多 Agent 架构入门:用 Telegram Bot 控制你的 AI Agent 集群OpenClaw 多 Agent 架构入门指南:通过 Telegram 控制 AI Agent 集群,支持子 Agent 编排、MCP 集成和多节点部署。含快速开始教程。2026/4/7教程OpenClaw Background Tasks 完全指南:让 AI 在后台自主执行长时间任务(2026)OpenClaw Background Tasks(后台任务)完整指南:Background Tasks 与普通对话的区别(异步执行/不阻塞渠道/可中断恢复)、通过自然语言触发后台任务(「帮我在后台处理...」)、openclaw tasks 命令行管理(list/show/cancel/logs)、任务状态跟踪与完成通知、长时间任务的最佳实践(分批处理/超时设置/错误恢复)、与 Cron Jobs 的区别和选用场景,以及实战案例(批量文件处理/代码库扫描/数据报告生成)。2026/4/2教程OpenClaw Polls 投票功能完全指南:在群聊中创建 AI 辅助投票(2026)OpenClaw Polls(投票)功能完整指南:AI 自动创建投票(对话中说「发起投票」即可)、支持的渠道(Telegram 原生投票/Discord 按钮投票/Slack 投票/WhatsApp 文字选项)、投票类型(单选/多选/匿名/限时)、AI 分析投票结果并给出建议、定时发起周期性投票(结合 Cron)、在群聊决策场景中的使用模式,以及各渠道投票交互方式差异对比。2026/4/2