
哈喽佬友们,又又又好久不见。之前立了一个PPT Agent的Flag,折腾了好几个月,终于可以来给大家交作业了。
先给大家看一些我们目前能生成的效果,后面我会把完整的思路分享出来。那以下页面,都是AI自动生成的,模型用的是Gemini 3的Flash版本。
可以搞定各种风格的设计:
你可能会想,这不就是又一个AI PPT玩具吗?
不。你只需要给它一个主题,比如“Dify企业介绍”,然后就可以去泡杯咖啡了。它会像一个真正的专家团队那样,自己跑完从需求调研 → 资料搜集 → 大纲策划 → 生成策划稿 → 生成设计稿的全流程。

最后做出这样一套完整的设计:

因为是商业项目,发在这里不太合规矩,我也不提名字了。但是我还是挺想把我们做这个的完整思路,包括用到的一部分提示词分享给大家的。
我可以非常自信地说,这绝对是一个你从未见过的PPT Agent思路。接下来的内容,希望能对你有所启发。
1.忘了“一键生成”,从“提问”开始
市面上几乎所有的AI PPT工具,都犯了一个致命的错误。
你一输入主题,它就猴急地给你丢出一个粗糙大纲,然后用一堆现成的模板糊弄你,恨不得马上把花里胡哨的设计怼到你脸上。
但说真的,PPT的灵魂是内容,不是皮囊。
想想我们自己做PPT的流程:是不是得先搞清楚“为谁做?做什么?达到什么目的?”
所以,我们让AI做的第一件事,就是像一个专业顾问一样去“需求调研” 。它会先去网上扒一圈相关资料,然后像模像样地问你几个关键问题,让你把真正的需求说清楚。
只有当我们把需求聊透了,它才会结合搜集到的资料,去生成一份真正“有的放矢”的大纲。
聊到大纲,我又把我用了多年的一个“笨方法”教给了AI——便利贴法。
过去我做复杂PPT时,会把每一页的核心内容写在一张张便利贴上,贴满一墙。这样逻辑结构一目了然,哪里不好就撕掉,顺序不对就调换,高效又直观。
现在,我们把它做进了产品里。每一个页面,就是一张“数字便利贴”,让你看得清清楚楚,调得明明白白。

这个思路,你完全可以自己复现。在你动工前,先别急着打开PPT软件,试试把你的需求完整地告诉AI,让它扮演你的“PPT规划师”。
下面这个我们项目在用的正式版Prompt,也直接开源给你,让你也能拥有一个顶级的“PPT结构架构师”:
# Role: 顶级的PPT结构架构师
## Profile
- 版本:2.0 (Context-Aware)
- 专业:PPT逻辑结构设计
- 特长:运用金字塔原理,结合**背景调研信息**构建清晰的演示逻辑
## Goals
基于用户提供的 **PPT主题** 和 **背景调研信息 (Context)**,设计一份逻辑严密、层次清晰的PPT大纲。
## Core Methodology: 金字塔原理
1. 结论先行:每个部分以核心观点开篇
2. 以上统下:上层观点是下层内容的总结
3. 归类分组:同一层级的内容属于同一逻辑范畴
4. 逻辑递进:内容按照某种逻辑顺序展开
## 重要:利用调研信息
你将获得一些关于主题的搜索摘要。请务必参考这些信息来规划大纲,使其切合当前的市场现状或技术事实,而不是凭空捏造。
例如:如果调研显示"某技术已过时",则不要将其作为核心推荐。
## 输出规范
请严格按照以下JSON格式输出,结果用[PPT_OUTLINE]和[/PPT_OUTLINE]包裹:
[PPT_OUTLINE]
{
"ppt_outline": {
"cover": {
"title": "引人注目的主标题",
"sub_title": "副标题",
"content": []
},
"table_of_contents": {
"title": "目录",
"content": ["第一部分标题", "第二部分标题", "..."]
},
"parts": [
{
"part_title": "第一部分:章节标题",
"pages": [
{ "title": "页面标题1", "content": [] },
{ "title": "页面标题2", "content": [] }
]
}
],
"end_page": {
"title": "总结与展望",
"content": []
}
}
}
[/PPT_OUTLINE]
## Constraints
1. 必须严格遵循JSON格式。
2. **页数要求*:{{PAGE_REQUIREMENTS}}
2.去大量检索资料。
大纲只是骨架,血肉需要真实、准确的信息来填充。这个因为很多工程上的问题,我们自己项目用的是国内的搜索接口。
但如果你想自己DIY这个流程,我墙裂推荐一个神器:Grok 。
别的不说,它是我目前用过搜索和信息总结能力最强的AI,没有之一。用法简单到发指:把上一步生成的大纲标题,一个一个丢给Grok,它就能帮你把所需资料搜集、整理得妥妥帖帖。
3.PPT居然还有策划稿?
拿到内容后,多数人就直接让AI上设计了。但我们多加了一个操作——策划 。
啥,PPT还要做策划呢?我想这个词很多PPT设计师都没听过,五年前,我也一样。
那时候我去到了一家国内顶尖的PPT设计公司,他们的PPT报价是1万+一页。
他们有一个专门的岗位,叫策划师。没错,你前面看到的,需求调研、资料检索,大纲规划,这事儿都归他们干。
他们最终会提供一个PPT草稿给到设计师,每页什么位置要放什么元素,用什么样的版式,全都固定好。
就像这样:
真正让AI去做PPT的时候,你也可以试试一样的处理。先让AI生成一个,不要各种复杂效果,简简单单,清清爽爽的页面初稿。
到后面再去加设计的效果:
我们做了大量测试,发现这套人类专家的工作流,AI完全能理解!策划部分负责版面规划,设计部分来做风格样式,跑下来的效果非常好。
你啥都不用干,等AI跑完这套流程就能用,甚至都不太需要改。
那当然,如果是一些特别重要的PPT,你也可以在策划稿阶段精调内容,再去让AI跑最终的设计,把效率和颜值都最大化。
4.用这个PPT技巧让AI跑设计。
我之前做PPT课程的时候,有一个可以给到“夯爆了”的PPT技巧,叫卡片式布局。
啥是卡片式布局呢,喏,你在苹果的发布会上经常能看到。把内容放进了一个个卡片里。
之前在论坛发了两篇文章,用的也是一样的卡片式布局的思路。
这样做有三大好处:
- 能装: 一页里能清晰地承载大量信息。
- 灵活: 卡片数量、大小、位置可以随意组合,版式变化无穷。
- AI能懂: 这是最关键的!我们发现,“卡片”是AI最容易理解和掌握的一种设计语言。
我们把这套方法论,写成了一段精确的指令,告诉AI如何像顶级设计师一样思考布局。这可以说是我们项目的核心壁垒之一,今天也一并分享了:
内容页的便当网格 (Bento Grid) 布局
这是一种灵活的网格系统,其布局应由内容本身的需求驱动,而非僵硬的模板。通过组合不同尺寸的卡片,创造出动态且视觉有趣的布局。
- 核心原则:
- 灵活性: 卡片数量不固定。可以是 1, 2, 3, 4, 5 或更多个,取决于如何更好地呈现信息。
- 层级感: 使用卡片尺寸建立视觉层级。最重要的信息放在最大的卡片上。
- 留白: 在所有卡片之间保持至少 20px 的间距。
- 布局组合示例:
- 单一焦点: 一张大卡片覆盖大部分区域 (w=1200, h=580)。适用于单一、有力的信息或详细的图表。
- 两栏布局:
- 50/50 对称: 两张等宽的卡片。
- 非对称: 一张较宽的卡片(如 2/3 宽度)用于主内容,一张较窄的(1/3 宽度)用于辅助信息、数据或图片。
- 三栏布局: 三张等宽的卡片,适合并列比较三项内容。
- 主次结合: 一张大的居中卡片,两侧各一张小的垂直卡片。
- 顶部英雄式: 顶部一张宽幅“英雄”卡片,下方是 2-4 个较小的等宽卡片网格。
- 混合网格 (自由度最高): 自由混合各种尺寸的卡片,例如一个中等方块、两个小的水平矩形和一个垂直矩形。这种方式可以极大地适应不同内容的需求。
如果大家自己去跑也很简单,拿你刚刚用Grok检索到的内容结果,加上我下面这段提示词:
作为精通信息架构与 SVG 编码的专家,你的任务是将完整的文字内容转化为一张高质量、结构化、具备高级感、简洁感和专业感的 SVG 演示文稿页面。要求如下:
1.画布: SVG viewBox 必须是 0 0 1280 720。
2.内容页的便当网格 (Bento Grid) 布局
这是一种灵活的网格系统,其布局应由内容本身的需求驱动,而非僵硬的模板。通过组合不同尺寸的卡片,创造出动态且视觉有趣的布局。
- 核心原则:
- 灵活性: 卡片数量不固定。可以是 1, 2, 3, 4, 5 或更多个,取决于如何更好地呈现信息。
- 层级感: 使用卡片尺寸建立视觉层级。最重要的信息放在最大的卡片上。
- 留白: 在所有卡片之间保持至少 20px 的间距。
- 布局组合示例:
- 单一焦点: 一张大卡片覆盖大部分区域 (w=1200, h=580)。适用于单一、有力的信息或详细的图表。
- 两栏布局:
- 50/50 对称: 两张等宽的卡片。
- 非对称: 一张较宽的卡片(如 2/3 宽度)用于主内容,一张较窄的(1/3 宽度)用于辅助信息、数据或图片。
- 三栏布局: 三张等宽的卡片,适合并列比较三项内容。
- 主次结合: 一张大的居中卡片,两侧各一张小的垂直卡片。
- 顶部英雄式: 顶部一张宽幅“英雄”卡片,下方是 2-4 个较小的等宽卡片网格。
- 混合网格 (自由度最高): 自由混合各种尺寸的卡片,例如一个中等方块、两个小的水平矩形和一个垂直矩形。这种方式可以极大地适应不同内容的需求。
请你根据我的内容输出SVG代码,我的内容是:
直接发送Gemini处理,我们用的是3 Flash,有条件可以直接上3.1 Pro:
它直接就能生成这样一整个页面的SVG代码了:
市面上的 AIPPT 大多是调用 Banana 或者生成 html,我们采用了生成整页 SVG 的方案。
SVG是一种PPT里兼容性最好的格式,生成的这个SVG代码你可以直接拖到Office 2016以上的版本里去做使用。
为什么选了这种SVG格式呢?说起来也是泪。
好处是可以导入 PPT,完全可编辑,甚至各种设计软件都支持,而且可以无限放大,保证清晰度。代价是,三个多月里我们花了大量时间处理 SVG,因为没人做过,一切都得从零开始,不断摸索。
如果你是自己使用,也不太需要可编辑性,我更推荐让AI生成HTML格式的,这个部分的提示词在之前的文章里有,感兴趣的佬友可以看看。
最后也想聊聊,为什么想把这个思路分享出来呢,特别是发的提示词已经是我们项目里用的。同事觉得我傻,不怕别人马上抄走吗。
那第一,我觉得,我现在做的这个东西,也只是挖掘了AI做PPT,大概5%的能力,我们还有非常多棒的思路,会去一一实现,这些对于PPT的理解和积累,是没办法复制的。
第二,我是真的不太服气。市面上这些AI PPT工具,他们的开发根本都不懂PPT。给个大纲,硬套模板,让很多人用完都说:AI PPT,也就这样了,不行。
不该是这样的。
我教了7年PPT,做了3年AI产品,我坚信,AI有能力也已经在改变我们制作和演示信息的方式。这些效果是现在我平衡成本和效果下,能跑出来的极限,但远远不是AI的极限。
我会持续在这里分享我的关于AI PPT的思考和探索,希望这些内容,能对同样在路上的你,有所帮助。




































































