op7418/document-illustrator-skill
帮你从文档生成对应的多张配图,内置了歸藏精心探索的图片风格,支持 16:9 和 3:4 两种比例,方便发小红书以及推特。
168 stars19 forksUpdated Jan 21, 2026
npx skills add op7418/document-illustrator-skillREADME
Document Illustrator
基于 AI 智能分析的文档配图生成工具
Document Illustrator 是一个 Claude Code Skill,它能智能理解文档内容,自动归纳核心要点,并为每个主题生成专业配图。无需依赖特定文档格式,AI 会理解内容并生成符合你选择风格的高质量图片。
✨ 核心特性
- 🤖 AI 智能归纳:自动理解文档内容,智能提取核心主题,无需依赖标题格式
- 📝 格式无关:支持任何格式的文档(Markdown、纯文本、PDF 等)
- 🎨 三种风格:渐变玻璃卡片、票据风格、矢量插画,满足不同场景需求
- 📐 灵活比例:支持 16:9(横屏)和 3:4(竖屏)两种图片比例
- 🖼️ 封面图可选:可生成概括全文的封面图作为系列配图的引导
- ✅ 内容完整:展示归纳结果供你确认,确保所有重要信息都被包含
🚀 快速开始
使用 npx 安装(推荐)
npx skills add https://github.com/op7418/Document-illustrator-skill
手动安装
- 克隆或下载本仓库到 Claude Skills 目录:
cd ~/.claude/skills/
git clone https://github.com/op7418/Document-illustrator-skill.git
-
配置 API 密钥(见下方"配置说明"部分)
-
安装 Python 依赖(见下方"环境要求"部分)
基本使用
在 Claude Code 中直接告诉 Claude:
帮我为这个文档生成配图:/path/to/document.md
或者:
我想为这篇文章生成一些配图
Claude 会引导你完成整个配图生成流程。
🎨 三种风格说明
1. 渐变玻璃卡片风格 (gradient-glass)
视觉特点:
- Apple Keynote 风格的极简主义设计
- 玻璃拟态(Glassmorphism)效果
- 深邃虚空黑或纯净陶瓷白基底
- 流动的极光渐变色
- 3D 玻璃物体和发光效果
适用场景:
- 科技产品介绍
- 数据分析报告
- 未来趋势展望
- 产品功能演示
2. 票据风格 (ticket)
视觉特点:
- 数字极简票券设计
- 高度对比的黑白配色
- 类似登机牌、门票的结构化布局
- 精确的几何分区
- 中英混排,多向文字布局
适用场景:
- 信息图表
- 统计数据展示
- 时间线和流程图
- 要点总结
3. 矢量插画风格 (vector-illustration)
视觉特点:
- 扁平化矢量插画
- 统一粗细的黑色轮廓线
- 复古柔和的配色方案
- 几何化处理
- 横向全景式构图
适用场景:
- 故事叙述
- 概念解释
- 教育内容
- 品牌宣传
📦 安装和配置
步骤 1: 安装 Skill
使用 npx(推荐):
npx skills add https://github.com/op7418/Document-illustrator-skill
手动安装:
cd ~/.claude/skills/
git clone https://github.com/op7418/Document-illustrator-skill.git
cd document-illustrator
步骤 2: 配置 API 密钥
-
获取 Gemini API 密钥:Google AI Studio
-
在 Skill 根目录创建
.env文件:
cd ~/.claude/skills/document-illustrator
echo "GEMINI_API_KEY=your-api-key-here" > .env
或直接编辑 .env 文件:
GEMINI_API_KEY=your-api-key-here
安全提示:
.env文件包含敏感信息,请勿提交到版本控制系统
步骤 3: 安装 Python 依赖
cd ~/.claude/skills/document-illustrator
pip install google-genai pillow python-dotenv
或使用 pip3:
pip3 install google-genai pillow python-dotenv
步骤 4: 验证安装
运行测试命令:
python3 scripts/generate_single_image.py --help
预期输出应显示脚本的帮助信息,表示安装成功。
📖 使用方法
方式 1: 通过 Claude Code 使用(推荐)
这是主要的使用方式,让 Claude 智能处理整个流程。
基本命令:
帮我为这个文档生成配图:~/blog/my-article.md
交互式流程:
-
选择图片比例
- 16:9(横屏)- 适合演示文稿、网站横幅
- 3:4(竖屏)- 适合社交媒体、手机查看
-
是否生成封面图
- 是 - 生成封面图 + 内容配图
- 否 - 仅生成内容配图
-
指定配图数量
- 根据文档长度,Claude 会推荐合适的数量
- 你可以自定义需要的图片数量(建议 3-10 张)
-
确认内容归纳
- Claude 会展示归纳的主题列表
- 确认所有重要内容都被包含
- 可以要求调整归纳结果
-
生成配图
- 确认后,自动调用 Gemini API 生成图片
- 图片保存到文档所在目录的
images/文件夹
完整示例:
用户: 帮我为 ~/documents/ai-evolution.md 生成配图,用渐变玻璃风格
Claude: 好的,让我先读取这个文档...
[读取并分析文档内容]
检测到文档长度约 3000 字。
请选择图片比例:
1. 16:9 (横屏)
2. 3:4 (竖屏)
用户: 1
Claude: 是否生成封面图?
1. 是
2. 否
用户: 是
Claude: 期望生成多少张内容配图?
建议范围:3-10 张
根据文档内容,推荐生成 5 张
用户: 5
Claude: 📋 内容归纳完成
📄 封面图内容:
"AI 技术演化:从规则到智能"
- 核心概念、演化路径、最佳实践
📚 内容配图(共 5 张):
1. AI 技术的起源
2. 机器学习的突破
3. 深度学习革命
4. 大语言模型时代
5. 未来发展趋势
✓ 所有内容已覆盖,无遗漏
确认开始生成配图吗?(Y/N)
用户: Y
Claude: 🖼️ 开始生成配图...
正在生成封面图...
✓ 已保存: ~/documents/images/cover.png
正在生成第 1/5 张...
✓ 已保存: ~/documents/images/illustration-01.png
...
✨ 完成!共生成 6 张配图
方式 2: 直接使用 Python 脚本(高级用户)
如果你想要更多控制或进行批量处理,可以直接调用 Python 脚本。
单图生成:
python3 scripts/generate_single_image.py \
--title "人工智能的未来" \
--content "AI 技术正在快速发展..." \
--style gradient-glass \
--aspect-ratio 16:9 \
--resolution 2K \
--output ~/output/image.png
参数说明:
--title: 图片标题--content: 图片内容描述--style: 风格(gradient-glass / ticket / vector-illustration)--aspect-ratio: 比例(16:9 / 3:4)--resolution: 分辨率(2K / 4K)--output: 输出文件路径
🔍 示例展示
示例 1: 技术文章配图

使用渐变玻璃卡片风格,16:9 比例,适合科技博客和演示文稿。
示例 2: 数据报告配图

使用票据风格,3:4 比例,适合信息图表和社交媒体分享。
示例 3: 教程配图

使用矢量插画风格,16:9 比例,适合教育内容和故事叙述。
注意:以上为示例占位符。实际生成的图片效果取决于文档内容和选择的风格。
⚙️ 工作原理
整体架构
📄 文档输入
↓
🤖 Claude 读取和理解
↓
💡 AI 智能归纳核心主题
↓
✅ 用户确认内容分配
↓
🎨 调用 Gemini API 生成图片
↓
💾 保存到本地目录
与传统方式的对比
传统方式:
代码解析标题 → 机械切分章节 → 生成配图
↓
❌ 依赖特定格式(## ###)
❌ 容易遗漏非标准内容
❌ 无法理解语义
Document Illustrator:
AI 理解内容 → 智能归纳主题 → 用户确认 → 生成配图
↓
✅ 格式无关,任何文档都能处理
✅ 保证内容完整性
✅ 用户可控
...
Publisher
Statistics
Stars168
Forks19
Open Issues0
LicenseMIT License
CreatedJan 21, 2026