Skip to content

用 MCP 自动化网页画图

一句话总结:让 AI 帮你操作浏览器,自动去即梦/Gemini 画图,下载到本地。


学完你能做什么

  • 用 AI 自动打开即梦/Gemini 网页版
  • 自动输入提示词生成图片
  • 自动下载图片到本地指定目录
  • 批量生成、批量下载,不用手动操作

你现在的困境

  • 想批量生成图片,但网页版要一个个点
  • 下载图片要手动右键另存为,效率低
  • API 版本要么没额度,要么要付费
  • 明明有现成的网页工具,却没法自动化

什么时候用这一招

  • 当你需要:批量生成图片,但不想手动操作
  • 而且不想:为每个 AI 画图工具单独对接 API
  • 特别是:你已经在用网页版,只是想让它更自动化

核心思路

┌─────────────────────────────────────────────────────────────┐
│                    网页画图自动化流程                         │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  ┌─────────┐    ┌─────────────┐    ┌─────────────┐         │
│  │ 打开网页 │ →  │ 输入提示词   │ →  │ 等待生成    │         │
│  └─────────┘    └─────────────┘    └─────────────┘         │
│                                          │                  │
│                                          ▼                  │
│  ┌─────────────┐    ┌─────────────┐    ┌─────────────┐     │
│  │ 保存到本地  │ ←  │ 点击下载    │ ←  │ 定位图片    │     │
│  └─────────────┘    └─────────────┘    └─────────────┘     │
│                                                             │
└─────────────────────────────────────────────────────────────┘

关键点:

  1. MCP 接管浏览器 —— 不需要 API,直接操作网页
  2. 等待生成完成 —— 用 wait_for 等待特定文字出现
  3. 自动下载 —— 点击下载按钮,浏览器自动保存

🎒 开始前的准备

确保你已经完成以下事项:


场景一:即梦 AI 画图

第 1 步:打开即梦页面

为什么
让 MCP 打开新页面,自动导航到即梦的图片生成页面。

直接告诉 AI:

打开即梦 AI,网址是 https://jimeng.jianying.com

AI 会调用 chrome-devtools_new_page 工具打开页面。

你应该看到:浏览器新标签页打开,显示即梦首页。

第 2 步:进入图片生成模式

为什么
即梦有多个功能(视频、图片、数字人等),需要进入图片生成模块。

AI 会:

  1. 截取页面快照(take_snapshot
  2. 找到「图片生成」按钮
  3. 点击进入

你应该看到:页面跳转到图片生成界面,有输入框。

第 3 步:输入提示词

为什么
告诉 AI 你想画什么。

输入提示词:宇宙英雄与东方神话猴王的史诗对决,电影级特效

AI 会调用 fill 工具,把文字填入输入框。

关于敏感词

即梦有内容审核,直接写「奥特曼」「孙悟空」可能被拦截。

替代写法:

  • 奥特曼 → 宇宙英雄、光之巨人
  • 孙悟空 → 东方神话猴王、齐天大圣

第 4 步:点击生成并等待

为什么
触发生成,然后等待图片完成。

AI 会:

  1. 点击生成按钮
  2. wait_for 等待「下载」「完成」等文字出现

等待时间:通常 30-60 秒,取决于服务器负载。

第 5 步:下载图片到本地

为什么
把生成的图片保存到你的电脑。

AI 会:

  1. 点击图片打开预览
  2. 找到「下载」按钮
  3. 点击下载

图片会保存到浏览器的默认下载目录:

  • macOS: ~/Downloads/~/下载/
  • Windows: C:\Users\你的用户名\Downloads\
  • Linux: ~/Downloads/~/下载/

即梦完整示例对话

你:打开即梦,画一张"赛博朋克风格的古代城墙",下载到桌面

AI:
1. 打开 https://jimeng.jianying.com/ai-tool/generate
2. 输入提示词
3. 点击生成
4. 等待完成(约 45 秒)
5. 点击下载
6. 图片已保存到 ~/Downloads/jimeng-xxx.png

即梦常见问题

问题原因解决
提示词被拦截敏感词过滤用替代描述,如「宇宙英雄」代替「奥特曼」
下载没反应首次下载有水印设置弹窗AI 会自动处理,或手动点一次「保存设置」
生成太慢服务器负载高耐心等待,可同时开多个会话

场景二:Gemini 画图

第 1 步:打开 Gemini

打开 Gemini,网址是 https://gemini.google.com/app

你应该看到:Gemini 聊天界面,有输入框。

第 2 步:输入画图提示词

画一个红苹果,写实风格,带有光泽感

Gemini 会自动识别这是画图请求,调用内置的图像生成功能。

第 3 步:等待生成完成

AI 用 wait_for 等待「下载」「复制」等按钮出现。

等待时间:通常 15-30 秒。

第 4 步:下载图片

Gemini 生成图片后,会有几个按钮:

  • 分享图片
  • 复制图片
  • 下载完整尺寸的图片 ← 点这个

AI 会点击下载按钮,图片保存到下载目录。

Gemini 完整示例对话

你:打开 Gemini,画一张"日落时分的海边灯塔",下载到本地

AI:
1. 打开 https://gemini.google.com/app
2. 输入:画一张日落时分的海边灯塔
3. 等待生成(约 20 秒)
4. 点击「下载完整尺寸的图片」
5. 图片已保存到 ~/Downloads/

Gemini vs 即梦对比

对比项Gemini即梦
访问方式需要科学上网国内直接访问
生成速度较快(15-30秒)较慢(30-60秒)
内容审核相对宽松较严格(敏感词拦截)
图片数量通常 1 张通常 4 张
下载方式直接下载需处理水印设置

进阶:批量生成

批量生成多张图

帮我生成以下 5 张图,都下载到桌面的 images 文件夹:

1. 赛博朋克风格的街道
2. 水墨画风格的山水
3. 卡通风格的可爱猫咪
4. 写实风格的咖啡杯
5. 抽象艺术风格的宇宙

AI 会依次:

  1. 打开画图网站
  2. 输入每个提示词
  3. 等待生成
  4. 下载保存
  5. 继续下一张

自动重命名下载文件

下载的文件名通常是随机字符串,可以让 AI 帮你重命名:

把刚下载的图片重命名为 cyberpunk-street.png
bash
mv ~/Downloads/jimeng-2026-03-15-xxx.png ~/Desktop/images/cyberpunk-street.png

检查点 ✅

  • [ ] 即梦能正常打开并生成图片
  • [ ] Gemini 能正常打开并生成图片
  • [ ] 图片能成功下载到本地
  • [ ] 知道下载目录在哪里
  • [ ] 知道如何处理敏感词拦截

踩坑提醒

现象原因解决
页面打不开网络问题Gemini 需科学上网;即梦检查账号登录状态
提示词被拦截内容审核用替代描述,避免品牌名/敏感词
下载目录找不到系统语言不同Linux 中文系统是 ~/下载/,英文是 ~/Downloads/
图片生成失败服务器繁忙等待后重试
MCP 连接失败Chrome 未启用远程调试检查 chrome://inspect/#remote-debugging

本课小结

你学会了:

  1. 用 MCP 操作网页画图工具 —— 不需要 API,直接控制浏览器
  2. 即梦实战 —— 处理敏感词、等待生成、下载图片
  3. Gemini 实战 —— 输入提示词、等待生成、下载图片
  4. 批量生成 —— 让 AI 依次完成多张图

核心流程:打开页面 → 输入提示词 → 等待生成 → 下载保存


延伸阅读

想深入了解 MCP 自动化?推荐阅读: