op7418/document-illustrator-skill

帮你从文档生成对应的多张配图,内置了歸藏精心探索的图片风格,支持 16:9 和 3:4 两种比例,方便发小红书以及推特。

168 stars19 forksUpdated Jan 21, 2026
npx skills add op7418/document-illustrator-skill

README

Document Illustrator

Document Illustrator Cover

基于 AI 智能分析的文档配图生成工具

License: MIT Python 3.8+

Document Illustrator 是一个 Claude Code Skill,它能智能理解文档内容,自动归纳核心要点,并为每个主题生成专业配图。无需依赖特定文档格式,AI 会理解内容并生成符合你选择风格的高质量图片。

✨ 核心特性

  • 🤖 AI 智能归纳:自动理解文档内容,智能提取核心主题,无需依赖标题格式
  • 📝 格式无关:支持任何格式的文档(Markdown、纯文本、PDF 等)
  • 🎨 三种风格:渐变玻璃卡片、票据风格、矢量插画,满足不同场景需求
  • 📐 灵活比例:支持 16:9(横屏)和 3:4(竖屏)两种图片比例
  • 🖼️ 封面图可选:可生成概括全文的封面图作为系列配图的引导
  • ✅ 内容完整:展示归纳结果供你确认,确保所有重要信息都被包含

🚀 快速开始

使用 npx 安装(推荐)

npx skills add https://github.com/op7418/Document-illustrator-skill

手动安装

  1. 克隆或下载本仓库到 Claude Skills 目录:
cd ~/.claude/skills/
git clone https://github.com/op7418/Document-illustrator-skill.git
  1. 配置 API 密钥(见下方"配置说明"部分)

  2. 安装 Python 依赖(见下方"环境要求"部分)

基本使用

在 Claude Code 中直接告诉 Claude:

帮我为这个文档生成配图:/path/to/document.md

或者:

我想为这篇文章生成一些配图

Claude 会引导你完成整个配图生成流程。

🎨 三种风格说明

1. 渐变玻璃卡片风格 (gradient-glass)

视觉特点

  • Apple Keynote 风格的极简主义设计
  • 玻璃拟态(Glassmorphism)效果
  • 深邃虚空黑或纯净陶瓷白基底
  • 流动的极光渐变色
  • 3D 玻璃物体和发光效果

适用场景

  • 科技产品介绍
  • 数据分析报告
  • 未来趋势展望
  • 产品功能演示

2. 票据风格 (ticket)

视觉特点

  • 数字极简票券设计
  • 高度对比的黑白配色
  • 类似登机牌、门票的结构化布局
  • 精确的几何分区
  • 中英混排,多向文字布局

适用场景

  • 信息图表
  • 统计数据展示
  • 时间线和流程图
  • 要点总结

3. 矢量插画风格 (vector-illustration)

视觉特点

  • 扁平化矢量插画
  • 统一粗细的黑色轮廓线
  • 复古柔和的配色方案
  • 几何化处理
  • 横向全景式构图

适用场景

  • 故事叙述
  • 概念解释
  • 教育内容
  • 品牌宣传

📦 安装和配置

步骤 1: 安装 Skill

使用 npx(推荐)

npx skills add https://github.com/op7418/Document-illustrator-skill

手动安装

cd ~/.claude/skills/
git clone https://github.com/op7418/Document-illustrator-skill.git
cd document-illustrator

步骤 2: 配置 API 密钥

  1. 获取 Gemini API 密钥:Google AI Studio

  2. 在 Skill 根目录创建 .env 文件:

cd ~/.claude/skills/document-illustrator
echo "GEMINI_API_KEY=your-api-key-here" > .env

或直接编辑 .env 文件:

GEMINI_API_KEY=your-api-key-here

安全提示.env 文件包含敏感信息,请勿提交到版本控制系统

步骤 3: 安装 Python 依赖

cd ~/.claude/skills/document-illustrator
pip install google-genai pillow python-dotenv

或使用 pip3:

pip3 install google-genai pillow python-dotenv

步骤 4: 验证安装

运行测试命令:

python3 scripts/generate_single_image.py --help

预期输出应显示脚本的帮助信息,表示安装成功。

📖 使用方法

方式 1: 通过 Claude Code 使用(推荐)

这是主要的使用方式,让 Claude 智能处理整个流程。

基本命令

帮我为这个文档生成配图:~/blog/my-article.md

交互式流程

  1. 选择图片比例

    • 16:9(横屏)- 适合演示文稿、网站横幅
    • 3:4(竖屏)- 适合社交媒体、手机查看
  2. 是否生成封面图

    • 是 - 生成封面图 + 内容配图
    • 否 - 仅生成内容配图
  3. 指定配图数量

    • 根据文档长度,Claude 会推荐合适的数量
    • 你可以自定义需要的图片数量(建议 3-10 张)
  4. 确认内容归纳

    • Claude 会展示归纳的主题列表
    • 确认所有重要内容都被包含
    • 可以要求调整归纳结果
  5. 生成配图

    • 确认后,自动调用 Gemini API 生成图片
    • 图片保存到文档所在目录的 images/ 文件夹

完整示例

用户: 帮我为 ~/documents/ai-evolution.md 生成配图,用渐变玻璃风格

Claude: 好的,让我先读取这个文档...
        [读取并分析文档内容]

        检测到文档长度约 3000 字。

        请选择图片比例:
        1. 16:9 (横屏)
        2. 3:4 (竖屏)

用户: 1

Claude: 是否生成封面图?
        1. 是
        2. 否

用户: 是

Claude: 期望生成多少张内容配图?
        建议范围:3-10 张
        根据文档内容,推荐生成 5 张

用户: 5

Claude: 📋 内容归纳完成

        📄 封面图内容:
        "AI 技术演化:从规则到智能"
        - 核心概念、演化路径、最佳实践

        📚 内容配图(共 5 张):
        1. AI 技术的起源
        2. 机器学习的突破
        3. 深度学习革命
        4. 大语言模型时代
        5. 未来发展趋势

        ✓ 所有内容已覆盖,无遗漏

        确认开始生成配图吗?(Y/N)

用户: Y

Claude: 🖼️  开始生成配图...

        正在生成封面图...
        ✓ 已保存: ~/documents/images/cover.png

        正在生成第 1/5 张...
        ✓ 已保存: ~/documents/images/illustration-01.png

        ...

        ✨ 完成!共生成 6 张配图

方式 2: 直接使用 Python 脚本(高级用户)

如果你想要更多控制或进行批量处理,可以直接调用 Python 脚本。

单图生成

python3 scripts/generate_single_image.py \
  --title "人工智能的未来" \
  --content "AI 技术正在快速发展..." \
  --style gradient-glass \
  --aspect-ratio 16:9 \
  --resolution 2K \
  --output ~/output/image.png

参数说明

  • --title: 图片标题
  • --content: 图片内容描述
  • --style: 风格(gradient-glass / ticket / vector-illustration)
  • --aspect-ratio: 比例(16:9 / 3:4)
  • --resolution: 分辨率(2K / 4K)
  • --output: 输出文件路径

🔍 示例展示

示例 1: 技术文章配图

技术文章示例

使用渐变玻璃卡片风格,16:9 比例,适合科技博客和演示文稿。

示例 2: 数据报告配图

数据报告示例

使用票据风格,3:4 比例,适合信息图表和社交媒体分享。

示例 3: 教程配图

教程示例

使用矢量插画风格,16:9 比例,适合教育内容和故事叙述。

注意:以上为示例占位符。实际生成的图片效果取决于文档内容和选择的风格。

⚙️ 工作原理

整体架构

📄 文档输入
    ↓
🤖 Claude 读取和理解
    ↓
💡 AI 智能归纳核心主题
    ↓
✅ 用户确认内容分配
    ↓
🎨 调用 Gemini API 生成图片
    ↓
💾 保存到本地目录

与传统方式的对比

传统方式

代码解析标题 → 机械切分章节 → 生成配图
    ↓
❌ 依赖特定格式(## ###)
❌ 容易遗漏非标准内容
❌ 无法理解语义

Document Illustrator

AI 理解内容 → 智能归纳主题 → 用户确认 → 生成配图
    ↓
✅ 格式无关,任何文档都能处理
✅ 保证内容完整性
✅ 用户可控

...
Read full README

Publisher

op7418op7418

Statistics

Stars168
Forks19
Open Issues0
LicenseMIT License
CreatedJan 21, 2026