用 MCP 自动化网页画图
一句话总结:让 AI 帮你操作浏览器,自动去即梦/Gemini 画图,下载到本地。
学完你能做什么
- 用 AI 自动打开即梦/Gemini 网页版
- 自动输入提示词生成图片
- 自动下载图片到本地指定目录
- 批量生成、批量下载,不用手动操作
你现在的困境
- 想批量生成图片,但网页版要一个个点
- 下载图片要手动右键另存为,效率低
- API 版本要么没额度,要么要付费
- 明明有现成的网页工具,却没法自动化
什么时候用这一招
- 当你需要:批量生成图片,但不想手动操作
- 而且不想:为每个 AI 画图工具单独对接 API
- 特别是:你已经在用网页版,只是想让它更自动化
核心思路
┌─────────────────────────────────────────────────────────────┐
│ 网页画图自动化流程 │
├─────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 打开网页 │ → │ 输入提示词 │ → │ 等待生成 │ │
│ └─────────┘ └─────────────┘ └─────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 保存到本地 │ ← │ 点击下载 │ ← │ 定位图片 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘关键点:
- MCP 接管浏览器 —— 不需要 API,直接操作网页
- 等待生成完成 —— 用
wait_for等待特定文字出现 - 自动下载 —— 点击下载按钮,浏览器自动保存
🎒 开始前的准备
确保你已经完成以下事项:
- [ ] 完成了 5.7c Chrome DevTools MCP
- [ ] Chrome 浏览器已启用远程调试
- [ ] 有即梦账号(https://jimeng.jianying.com)
- [ ] 有 Gemini 账号(https://gemini.google.com)
场景一:即梦 AI 画图
第 1 步:打开即梦页面
为什么
让 MCP 打开新页面,自动导航到即梦的图片生成页面。
直接告诉 AI:
打开即梦 AI,网址是 https://jimeng.jianying.comAI 会调用 chrome-devtools_new_page 工具打开页面。
你应该看到:浏览器新标签页打开,显示即梦首页。
第 2 步:进入图片生成模式
为什么
即梦有多个功能(视频、图片、数字人等),需要进入图片生成模块。
AI 会:
- 截取页面快照(
take_snapshot) - 找到「图片生成」按钮
- 点击进入
你应该看到:页面跳转到图片生成界面,有输入框。
第 3 步:输入提示词
为什么
告诉 AI 你想画什么。
输入提示词:宇宙英雄与东方神话猴王的史诗对决,电影级特效AI 会调用 fill 工具,把文字填入输入框。
关于敏感词
即梦有内容审核,直接写「奥特曼」「孙悟空」可能被拦截。
替代写法:
- 奥特曼 → 宇宙英雄、光之巨人
- 孙悟空 → 东方神话猴王、齐天大圣
第 4 步:点击生成并等待
为什么
触发生成,然后等待图片完成。
AI 会:
- 点击生成按钮
- 用
wait_for等待「下载」「完成」等文字出现
等待时间:通常 30-60 秒,取决于服务器负载。
第 5 步:下载图片到本地
为什么
把生成的图片保存到你的电脑。
AI 会:
- 点击图片打开预览
- 找到「下载」按钮
- 点击下载
图片会保存到浏览器的默认下载目录:
- macOS:
~/Downloads/或~/下载/ - Windows:
C:\Users\你的用户名\Downloads\ - Linux:
~/Downloads/或~/下载/
即梦完整示例对话
你:打开即梦,画一张"赛博朋克风格的古代城墙",下载到桌面
AI:
1. 打开 https://jimeng.jianying.com/ai-tool/generate
2. 输入提示词
3. 点击生成
4. 等待完成(约 45 秒)
5. 点击下载
6. 图片已保存到 ~/Downloads/jimeng-xxx.png即梦常见问题
| 问题 | 原因 | 解决 |
|---|---|---|
| 提示词被拦截 | 敏感词过滤 | 用替代描述,如「宇宙英雄」代替「奥特曼」 |
| 下载没反应 | 首次下载有水印设置弹窗 | AI 会自动处理,或手动点一次「保存设置」 |
| 生成太慢 | 服务器负载高 | 耐心等待,可同时开多个会话 |
场景二:Gemini 画图
第 1 步:打开 Gemini
打开 Gemini,网址是 https://gemini.google.com/app你应该看到:Gemini 聊天界面,有输入框。
第 2 步:输入画图提示词
画一个红苹果,写实风格,带有光泽感Gemini 会自动识别这是画图请求,调用内置的图像生成功能。
第 3 步:等待生成完成
AI 用 wait_for 等待「下载」「复制」等按钮出现。
等待时间:通常 15-30 秒。
第 4 步:下载图片
Gemini 生成图片后,会有几个按钮:
- 分享图片
- 复制图片
- 下载完整尺寸的图片 ← 点这个
AI 会点击下载按钮,图片保存到下载目录。
Gemini 完整示例对话
你:打开 Gemini,画一张"日落时分的海边灯塔",下载到本地
AI:
1. 打开 https://gemini.google.com/app
2. 输入:画一张日落时分的海边灯塔
3. 等待生成(约 20 秒)
4. 点击「下载完整尺寸的图片」
5. 图片已保存到 ~/Downloads/Gemini vs 即梦对比
| 对比项 | Gemini | 即梦 |
|---|---|---|
| 访问方式 | 需要科学上网 | 国内直接访问 |
| 生成速度 | 较快(15-30秒) | 较慢(30-60秒) |
| 内容审核 | 相对宽松 | 较严格(敏感词拦截) |
| 图片数量 | 通常 1 张 | 通常 4 张 |
| 下载方式 | 直接下载 | 需处理水印设置 |
进阶:批量生成
批量生成多张图
帮我生成以下 5 张图,都下载到桌面的 images 文件夹:
1. 赛博朋克风格的街道
2. 水墨画风格的山水
3. 卡通风格的可爱猫咪
4. 写实风格的咖啡杯
5. 抽象艺术风格的宇宙AI 会依次:
- 打开画图网站
- 输入每个提示词
- 等待生成
- 下载保存
- 继续下一张
自动重命名下载文件
下载的文件名通常是随机字符串,可以让 AI 帮你重命名:
把刚下载的图片重命名为 cyberpunk-street.pngbash
mv ~/Downloads/jimeng-2026-03-15-xxx.png ~/Desktop/images/cyberpunk-street.png检查点 ✅
- [ ] 即梦能正常打开并生成图片
- [ ] Gemini 能正常打开并生成图片
- [ ] 图片能成功下载到本地
- [ ] 知道下载目录在哪里
- [ ] 知道如何处理敏感词拦截
踩坑提醒
| 现象 | 原因 | 解决 |
|---|---|---|
| 页面打不开 | 网络问题 | Gemini 需科学上网;即梦检查账号登录状态 |
| 提示词被拦截 | 内容审核 | 用替代描述,避免品牌名/敏感词 |
| 下载目录找不到 | 系统语言不同 | Linux 中文系统是 ~/下载/,英文是 ~/Downloads/ |
| 图片生成失败 | 服务器繁忙 | 等待后重试 |
| MCP 连接失败 | Chrome 未启用远程调试 | 检查 chrome://inspect/#remote-debugging |
本课小结
你学会了:
- 用 MCP 操作网页画图工具 —— 不需要 API,直接控制浏览器
- 即梦实战 —— 处理敏感词、等待生成、下载图片
- Gemini 实战 —— 输入提示词、等待生成、下载图片
- 批量生成 —— 让 AI 依次完成多张图
核心流程:打开页面 → 输入提示词 → 等待生成 → 下载保存
延伸阅读
想深入了解 MCP 自动化?推荐阅读:
- 5.7c Chrome DevTools MCP — MCP 浏览器控制的完整配置和用法
- C4 自动化脚本 — 用 AI 编写自动化脚本处理重复任务

