用 MCP 自动化网页画图

一句话总结：让 AI 帮你操作浏览器，自动去即梦/Gemini 画图，下载到本地。

学完你能做什么

用 AI 自动打开即梦/Gemini 网页版
自动输入提示词生成图片
自动下载图片到本地指定目录
批量生成、批量下载，不用手动操作

你现在的困境

想批量生成图片，但网页版要一个个点
下载图片要手动右键另存为，效率低
API 版本要么没额度，要么要付费
明明有现成的网页工具，却没法自动化

什么时候用这一招

当你需要：批量生成图片，但不想手动操作
而且不想：为每个 AI 画图工具单独对接 API
特别是：你已经在用网页版，只是想让它更自动化

核心思路

┌─────────────────────────────────────────────────────────────┐
│                    网页画图自动化流程                         │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  ┌─────────┐    ┌─────────────┐    ┌─────────────┐         │
│  │ 打开网页 │ →  │ 输入提示词   │ →  │ 等待生成    │         │
│  └─────────┘    └─────────────┘    └─────────────┘         │
│                                          │                  │
│                                          ▼                  │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐     │
│  │ 保存到本地  │ ←  │ 点击下载    │ ←  │ 定位图片    │     │
│  └─────────────┘    └─────────────┘    └─────────────┘     │
│                                                             │
└─────────────────────────────────────────────────────────────┘

关键点：

MCP 接管浏览器 —— 不需要 API，直接操作网页
等待生成完成 —— 用 wait_for 等待特定文字出现
自动下载 —— 点击下载按钮，浏览器自动保存

🎒 开始前的准备

确保你已经完成以下事项：

[ ] 完成了 5.7c Chrome DevTools MCP
[ ] Chrome 浏览器已启用远程调试
[ ] 有即梦账号（https://jimeng.jianying.com）
[ ] 有 Gemini 账号（https://gemini.google.com）

场景一：即梦 AI 画图

第 1 步：打开即梦页面

为什么
让 MCP 打开新页面，自动导航到即梦的图片生成页面。

直接告诉 AI：

打开即梦 AI，网址是 https://jimeng.jianying.com

AI 会调用 chrome-devtools_new_page 工具打开页面。

你应该看到：浏览器新标签页打开，显示即梦首页。

第 2 步：进入图片生成模式

为什么
即梦有多个功能（视频、图片、数字人等），需要进入图片生成模块。

AI 会：

截取页面快照（take_snapshot）
找到「图片生成」按钮
点击进入

你应该看到：页面跳转到图片生成界面，有输入框。

第 3 步：输入提示词

为什么
告诉 AI 你想画什么。

输入提示词：宇宙英雄与东方神话猴王的史诗对决，电影级特效

AI 会调用 fill 工具，把文字填入输入框。

关于敏感词

即梦有内容审核，直接写「奥特曼」「孙悟空」可能被拦截。

替代写法：

奥特曼 → 宇宙英雄、光之巨人
孙悟空 → 东方神话猴王、齐天大圣

第 4 步：点击生成并等待

为什么
触发生成，然后等待图片完成。

AI 会：

点击生成按钮
用 wait_for 等待「下载」「完成」等文字出现

等待时间：通常 30-60 秒，取决于服务器负载。

第 5 步：下载图片到本地

为什么
把生成的图片保存到你的电脑。

AI 会：

点击图片打开预览
找到「下载」按钮
点击下载

图片会保存到浏览器的默认下载目录：

macOS: ~/Downloads/ 或 ~/下载/
Windows: C:\Users\你的用户名\Downloads\
Linux: ~/Downloads/ 或 ~/下载/

即梦完整示例对话

你：打开即梦，画一张"赛博朋克风格的古代城墙"，下载到桌面

AI：
1. 打开 https://jimeng.jianying.com/ai-tool/generate
2. 输入提示词
3. 点击生成
4. 等待完成（约 45 秒）
5. 点击下载
6. 图片已保存到 ~/Downloads/jimeng-xxx.png

即梦常见问题

问题	原因	解决
提示词被拦截	敏感词过滤	用替代描述，如「宇宙英雄」代替「奥特曼」
下载没反应	首次下载有水印设置弹窗	AI 会自动处理，或手动点一次「保存设置」
生成太慢	服务器负载高	耐心等待，可同时开多个会话

场景二：Gemini 画图

第 1 步：打开 Gemini

打开 Gemini，网址是 https://gemini.google.com/app

你应该看到：Gemini 聊天界面，有输入框。

第 2 步：输入画图提示词

画一个红苹果，写实风格，带有光泽感

Gemini 会自动识别这是画图请求，调用内置的图像生成功能。

第 3 步：等待生成完成

AI 用 wait_for 等待「下载」「复制」等按钮出现。

等待时间：通常 15-30 秒。

第 4 步：下载图片

Gemini 生成图片后，会有几个按钮：

分享图片
复制图片
下载完整尺寸的图片 ← 点这个

AI 会点击下载按钮，图片保存到下载目录。

Gemini 完整示例对话

你：打开 Gemini，画一张"日落时分的海边灯塔"，下载到本地

AI：
1. 打开 https://gemini.google.com/app
2. 输入：画一张日落时分的海边灯塔
3. 等待生成（约 20 秒）
4. 点击「下载完整尺寸的图片」
5. 图片已保存到 ~/Downloads/

Gemini vs 即梦对比

对比项	Gemini	即梦
访问方式	需要科学上网	国内直接访问
生成速度	较快（15-30秒）	较慢（30-60秒）
内容审核	相对宽松	较严格（敏感词拦截）
图片数量	通常 1 张	通常 4 张
下载方式	直接下载	需处理水印设置

进阶：批量生成

批量生成多张图

帮我生成以下 5 张图，都下载到桌面的 images 文件夹：

1. 赛博朋克风格的街道
2. 水墨画风格的山水
3. 卡通风格的可爱猫咪
4. 写实风格的咖啡杯
5. 抽象艺术风格的宇宙

AI 会依次：

打开画图网站
输入每个提示词
等待生成
下载保存
继续下一张

自动重命名下载文件

下载的文件名通常是随机字符串，可以让 AI 帮你重命名：

把刚下载的图片重命名为 cyberpunk-street.png

bash

mv ~/Downloads/jimeng-2026-03-15-xxx.png ~/Desktop/images/cyberpunk-street.png

检查点 ✅

[ ] 即梦能正常打开并生成图片
[ ] Gemini 能正常打开并生成图片
[ ] 图片能成功下载到本地
[ ] 知道下载目录在哪里
[ ] 知道如何处理敏感词拦截

踩坑提醒

现象	原因	解决
页面打不开	网络问题	Gemini 需科学上网；即梦检查账号登录状态
提示词被拦截	内容审核	用替代描述，避免品牌名/敏感词
下载目录找不到	系统语言不同	Linux 中文系统是 `~/下载/`，英文是 `~/Downloads/`
图片生成失败	服务器繁忙	等待后重试
MCP 连接失败	Chrome 未启用远程调试	检查 `chrome://inspect/#remote-debugging`

本课小结

你学会了：

用 MCP 操作网页画图工具 —— 不需要 API，直接控制浏览器
即梦实战 —— 处理敏感词、等待生成、下载图片
Gemini 实战 —— 输入提示词、等待生成、下载图片
批量生成 —— 让 AI 依次完成多张图

核心流程：打开页面 → 输入提示词 → 等待生成 → 下载保存

用 MCP 自动化网页画图 ​

学完你能做什么 ​

你现在的困境 ​

什么时候用这一招 ​

核心思路 ​

🎒 开始前的准备 ​

场景一：即梦 AI 画图 ​

第 1 步：打开即梦页面 ​

第 2 步：进入图片生成模式 ​

第 3 步：输入提示词 ​

第 4 步：点击生成并等待 ​

第 5 步：下载图片到本地 ​

即梦完整示例对话 ​

即梦常见问题 ​

场景二：Gemini 画图 ​

第 1 步：打开 Gemini ​

第 2 步：输入画图提示词 ​

第 3 步：等待生成完成 ​

第 4 步：下载图片 ​

Gemini 完整示例对话 ​

Gemini vs 即梦对比 ​

进阶：批量生成 ​

批量生成多张图 ​

自动重命名下载文件 ​

检查点 ✅ ​

踩坑提醒 ​

本课小结 ​

延伸阅读 ​

用 MCP 自动化网页画图

学完你能做什么

你现在的困境

什么时候用这一招

核心思路

🎒 开始前的准备

场景一：即梦 AI 画图

第 1 步：打开即梦页面

第 2 步：进入图片生成模式

第 3 步：输入提示词

第 4 步：点击生成并等待

第 5 步：下载图片到本地

即梦完整示例对话

即梦常见问题

场景二：Gemini 画图

第 1 步：打开 Gemini

第 2 步：输入画图提示词

第 3 步：等待生成完成

第 4 步：下载图片

Gemini 完整示例对话

Gemini vs 即梦对比

进阶：批量生成

批量生成多张图

自动重命名下载文件

检查点 ✅

踩坑提醒

本课小结

延伸阅读