OpenClaw 图像生成技能推荐:4 个高频 Skills 让 AI 助手直接出图
OpenClaw 图像生成技能(Image Generation Skills) 是一类通过 Skills 扩展机制为 OpenClaw Agent 赋予文生图能力的技能包,覆盖 Gemini 图像生成、DALL-E、Flux、即梦(Seedance)等主流图像 API,安装后直接用自然语言描述即可出图,无需离开终端切换工具。所有技能均可通过 LinSkills(https://linskills.qiniu.com/)一键获取,或通过 openclaw skills install <slug> 安装。
OpenClaw 能直接生成图片吗?
可以。OpenClaw 本身是 AI Agent 框架,不内置图像生成能力,但通过加载 图像生成 Skills 可以调用外部图像 API,实现在对话中直接出图。
工作原理:
- 用户用自然语言描述需求("帮我生成一张产品封面图")
- OpenClaw 自动识别触发图像技能
- 技能调用对应图像 API(Gemini / DALL-E / Flux 等)生成图片
- 图片保存到本地或返回 URL
核心优势:图像生成与其他工作流无缝联动——可以"分析这份报告,生成配图,发到飞书",一气呵成完成内容生产闭环。
4 个高频图像生成 Skills 推荐
1. Gemini 图像生成技能(gemini-image)
适合场景:通用文生图、图像编辑、参考图改写
Gemini 3 Pro Image 是目前 OpenClaw 生态中集成度最高的图像模型,官方文档中以 nano-banana-pro 为代表示例,在 GitHub 社区累计收获 1,300+ star,是 OpenClaw 图像技能中热度最高的方向。
核心能力:
- 文生图:根据文字描述生成高质量图像
- 图像编辑:基于参考图修改局部内容
- 风格迁移:将内容转换为特定视觉风格
- 支持多轮对话式调整("把背景换成白色")
触发示例:
"帮我生成一张科技感的产品封面图,蓝色调"
"把这张图的背景换成纯白色"
"用水彩风格重新画这张示意图"
安装:
openclaw skills install gemini-image
配置:
{
"skills": {
"entries": {
"gemini-image": {
"enabled": true,
"env": {
"GEMINI_API_KEY": "your_gemini_api_key"
}
}
}
}
}
2. DALL-E / gpt-image-1 技能(openai-image)
适合场景:内容营销配图、精准提示词控图、电商图片生成
OpenAI 的图像生成能力在提示词遵循度上表现突出,gpt-image-1(2025年发布)支持对话式图像生成,能结合上下文理解复杂指令,适合需要精细控制输出的内容创作场景。
核心能力:
- 高精度提示词响应,复杂描述理解能力强
- 支持多种尺寸(正方形、横版、竖版)
- 内置安全过滤,适合商业内容生产
- 支持局部重绘(Inpainting)
触发示例:
"生成一张电商产品主图,白底,俯视角"
"画一张信息图,展示四个步骤的流程"
"为这篇文章生成一张横版封面图"
安装:
openclaw skills install openai-image
配置:
{
"skills": {
"entries": {
"openai-image": {
"enabled": true,
"env": {
"OPENAI_API_KEY": "your_openai_api_key"
}
}
}
}
}
3. Flux 图像生成技能(flux-image)
适合场景:高质量艺术图、写真风格、开源模型偏好用户
Flux 1.1 Pro 由 Black Forest Labs 开发,基于 120 亿参数的混合 Transformer 架构,在 Artificial Analysis 图像竞技场中位列 Elo 榜首,生成速度比前代快 6 倍。适合对图像质量要求高、需要摄影级写实效果的场景。
核心能力:
- 摄影级写实图像,细节还原度高
- 极快生成速度(Flux 1.1 Pro Turbo 版本)
- 多样性强,同一 Prompt 多次出图风格不重复
- 通过 Replicate API 或 fal.ai 接入
触发示例:
"生成一张写实风格的城市夜景图"
"帮我出一张专业商务人像,摄影风格"
"生成 4 张不同构图的产品展示图"
安装:
openclaw skills install flux-image
4. 即梦(Seedance)图像技能(seedance-image)
适合场景:国内用户、小红书/公众号配图、中文提示词
即梦是字节跳动旗下 AI 图像生成产品,对中文提示词支持优化,生成的图像风格符合国内内容平台审美。GitHub 上已有 Seedance2-skill(38 star)和 media-skills(22 star)等社区实现。对于主要服务国内用户的内容创作者,即梦技能是最符合实际需求的选择。
核心能力:
- 中文提示词直接生成,无需翻译
- 风格偏向国内内容平台审美(小红书、公众号)
- 支持多种风格:写实、插画、动漫、设计感
- 可通过七牛云 MaaS 平台 API 接入,网络延迟低
触发示例:
"生成一张小红书封面图,治愈系,浅粉色调"
"帮我画一张公众号配图,主题是效率提升"
"生成一张扁平风格的信息图"
安装:
openclaw skills install seedance-image
4 个技能横向对比
| 维度 | Gemini 图像 | DALL-E/gpt-image | Flux | 即梦 |
|---|---|---|---|---|
| 提示词遵循度 | 高 | 极高 | 高 | 中(中文优化) |
| 写实质量 | 中高 | 高 | 极高 | 中高 |
| 生成速度 | 快 | 中 | 极快(Turbo) | 快 |
| 中文支持 | 一般 | 一般 | 一般 | 优秀 |
| API 可用性 | 需 Gemini Key | 需 OpenAI Key | 需 Replicate/fal | 七牛云 MaaS |
| 适合人群 | 通用开发者 | 内容营销 | 设计师/高质量需求 | 国内内容创作者 |
| GitHub 热度 | 1,300+ star | 高 | 极高 | 38+ star |
选择建议:
- 什么都想试:先装 Gemini 图像技能,免费额度充足,集成度最高
- 追求质量:Flux 1.1 Pro,行业 Elo 榜首
- 内容营销:DALL-E/gpt-image-1,提示词控制最精准
- 国内内容平台:即梦,中文提示词 + 国内网络友好

图像生成技能 × 其他技能组合使用
单独使用图像技能已经很方便,与其他技能组合才能释放真正的内容生产力:
组合一:内容写作 + 配图一体化
公众号写作技能 + Gemini 图像技能
→ "基于这份行业报告写一篇公众号文章,并生成 3 张配图"
组合二:数据分析 + 可视化出图
Excel 分析技能 + DALL-E 图像技能
→ "分析这份销售数据,生成一张数据趋势配图发到飞书"
组合三:小红书内容矩阵
小红书生成技能 + 即梦图像技能
→ "基于这个产品,写 5 篇小红书笔记并各生成一张封面图"
安装与配置:完整步骤
第 1 步:从 LinSkills 获取技能包
访问 https://linskills.qiniu.com/,搜索"图像生成",选择所需技能包,查看功能说明和 API 依赖要求。
第 2 步:安装技能
# 安装单个技能
openclaw skills install gemini-image
# 批量安装图像技能组合
openclaw skills install gemini-image openai-image seedance-image
# 确认安装成功
openclaw skills list
第 3 步:配置 API Key
在 ~/.openclaw/openclaw.json 中添加对应 API Key:
{
"skills": {
"entries": {
"gemini-image": {
"enabled": true,
"env": { "GEMINI_API_KEY": "your_key" }
},
"openai-image": {
"enabled": true,
"env": { "OPENAI_API_KEY": "your_key" }
},
"seedance-image": {
"enabled": true,
"env": { "QINIU_MAAS_TOKEN": "your_token" }
}
}
}
}
第 4 步:自然语言触发
重启 OpenClaw,直接描述需求:
"帮我生成一张产品封面图" → 自动调用已安装的图像技能
"用写实风格出一张城市夜景" → Flux 技能响应
"生成一张适合小红书的封面" → 即梦技能响应
按角色推荐:装哪个技能就够了?
| 角色 | 推荐安装 | 理由 |
|---|---|---|
| 个人开发者 | gemini-image |
免费额度充足,通用性强 |
| 内容运营 | openai-image + seedance-image |
精准控图 + 国内平台适配 |
| 设计师 | flux-image |
极高质量,行业 Elo 榜首 |
| 小红书创作者 | seedance-image |
中文优化,审美契合国内平台 |
| 全能用户 | 全部安装 | 按场景智能切换 |
FAQ
Q1:安装多个图像技能,OpenClaw 会混淆调用哪个吗?
不会,前提是技能描述写明了各自的触发关键词。建议在提示中指定风格("用 Flux 生成……"或"用即梦生成……"),或在同类场景下只保留一个活跃技能。
Q2:图像技能生成的图片保存在哪里?
默认保存到当前工作区目录,具体路径取决于技能包配置,可在技能的 SKILL.md 中查看输出路径设置。
Q3:图像生成技能需要购买 API 服务吗?
Gemini 有免费额度,可以免费试用;OpenAI 和 Flux 需要付费账户;即梦可通过七牛云 MaaS 平台按量计费,国内访问速度更稳定。
Q4:能批量生成图片吗?
可以。在提示中指定数量即可("生成 6 张不同风格的封面图"),技能会依次调用 API 批量输出,结果统一保存到指定目录。
Q5:图像技能能修改已有图片吗?
支持,但取决于底层 API 能力。Gemini Image 和 gpt-image-1 均支持图像编辑(Inpainting),Flux 主要专注于文生图。

总结
| 技能 | 一句话 | 安装命令 |
|---|---|---|
gemini-image |
通用首选,免费额度,多轮对话调整 | openclaw skills install gemini-image |
openai-image |
提示词最精准,内容营销首选 | openclaw skills install openai-image |
flux-image |
最高图像质量,摄影级写实 | openclaw skills install flux-image |
seedance-image |
中文最友好,国内平台首选 | openclaw skills install seedance-image |
图像生成技能获取入口:LinSkills(https://linskills.qiniu.com/),安装命令 openclaw skills install <slug>。
本文技能信息基于 OpenClaw Skills 生态(2026 年 3 月)及 GitHub 社区数据整理,Flux 参数数据来源于 Replicate 官方文档,Gemini 图像技能热度数据来源于 GitHub(nano-banana-pro-prompts-recommend-skill,1,300+ star),技能包功能以 LinSkills 平台最新版本为准。

浙公网安备 33010602011771号