应该是目前最强的PPT Agent,附上完整思路分享

开发调优 人工智能 软件开发 精华神帖
查看原帖
sandun
sandun 楼主
#1

哈喽佬友们,又又又好久不见。之前立了一个PPT Agent的Flag,折腾了好几个月,终于可以来给大家交作业了。

先给大家看一些我们目前能生成的效果,后面我会把完整的思路分享出来。那以下页面,都是AI自动生成的,模型用的是Gemini 3的Flash版本。

可以搞定各种风格的设计:

你可能会想,这不就是又一个AI PPT玩具吗?

不。你只需要给它一个主题,比如“Dify企业介绍”,然后就可以去泡杯咖啡了。它会像一个真正的专家团队那样,自己跑完从需求调研 → 资料搜集 → 大纲策划 → 生成策划稿 → 生成设计稿的全流程。

3333

最后做出这样一套完整的设计:

640 (5)

因为是商业项目,发在这里不太合规矩,我也不提名字了。但是我还是挺想把我们做这个的完整思路,包括用到的一部分提示词分享给大家的。

我可以非常自信地说,这绝对是一个你从未见过的PPT Agent思路。接下来的内容,希望能对你有所启发。

1.忘了“一键生成”,从“提问”开始

市面上几乎所有的AI PPT工具,都犯了一个致命的错误。

你一输入主题,它就猴急地给你丢出一个粗糙大纲,然后用一堆现成的模板糊弄你,恨不得马上把花里胡哨的设计怼到你脸上。

但说真的,PPT的灵魂是内容,不是皮囊。

想想我们自己做PPT的流程:是不是得先搞清楚“为谁做?做什么?达到什么目的?”

所以,我们让AI做的第一件事,就是像一个专业顾问一样去“需求调研” 。它会先去网上扒一圈相关资料,然后像模像样地问你几个关键问题,让你把真正的需求说清楚。

只有当我们把需求聊透了,它才会结合搜集到的资料,去生成一份真正“有的放矢”的大纲。

聊到大纲,我又把我用了多年的一个“笨方法”教给了AI——便利贴法

过去我做复杂PPT时,会把每一页的核心内容写在一张张便利贴上,贴满一墙。这样逻辑结构一目了然,哪里不好就撕掉,顺序不对就调换,高效又直观。

现在,我们把它做进了产品里。每一个页面,就是一张“数字便利贴”,让你看得清清楚楚,调得明明白白。

1

这个思路,你完全可以自己复现。在你动工前,先别急着打开PPT软件,试试把你的需求完整地告诉AI,让它扮演你的“PPT规划师”。

下面这个我们项目在用的正式版Prompt,也直接开源给你,让你也能拥有一个顶级的“PPT结构架构师”:

# Role: 顶级的PPT结构架构师

## Profile
- 版本:2.0 (Context-Aware)
- 专业:PPT逻辑结构设计
- 特长:运用金字塔原理,结合**背景调研信息**构建清晰的演示逻辑

## Goals
基于用户提供的 **PPT主题** 和 **背景调研信息 (Context)**,设计一份逻辑严密、层次清晰的PPT大纲。

## Core Methodology: 金字塔原理
1. 结论先行:每个部分以核心观点开篇
2. 以上统下:上层观点是下层内容的总结
3. 归类分组:同一层级的内容属于同一逻辑范畴
4. 逻辑递进:内容按照某种逻辑顺序展开

## 重要:利用调研信息
你将获得一些关于主题的搜索摘要。请务必参考这些信息来规划大纲,使其切合当前的市场现状或技术事实,而不是凭空捏造。
例如:如果调研显示"某技术已过时",则不要将其作为核心推荐。

## 输出规范
请严格按照以下JSON格式输出,结果用[PPT_OUTLINE]和[/PPT_OUTLINE]包裹:

[PPT_OUTLINE]
{
  "ppt_outline": {
    "cover": {
      "title": "引人注目的主标题",
      "sub_title": "副标题",
      "content": []
    },
    "table_of_contents": {
      "title": "目录",
      "content": ["第一部分标题", "第二部分标题", "..."]
    },
    "parts": [
      {
        "part_title": "第一部分:章节标题",
        "pages": [
          { "title": "页面标题1", "content": [] },
          { "title": "页面标题2", "content": [] }
        ]
      }
    ],
    "end_page": {
      "title": "总结与展望",
      "content": []
    }
  }
}
[/PPT_OUTLINE]

## Constraints
1. 必须严格遵循JSON格式。
2. **页数要求*:{{PAGE_REQUIREMENTS}}

2.去大量检索资料。

大纲只是骨架,血肉需要真实、准确的信息来填充。这个因为很多工程上的问题,我们自己项目用的是国内的搜索接口。

但如果你想自己DIY这个流程,我墙裂推荐一个神器:Grok

别的不说,它是我目前用过搜索和信息总结能力最强的AI,没有之一。用法简单到发指:把上一步生成的大纲标题,一个一个丢给Grok,它就能帮你把所需资料搜集、整理得妥妥帖帖。

3.PPT居然还有策划稿?

拿到内容后,多数人就直接让AI上设计了。但我们多加了一个操作——策划

啥,PPT还要做策划呢?我想这个词很多PPT设计师都没听过,五年前,我也一样。

那时候我去到了一家国内顶尖的PPT设计公司,他们的PPT报价是1万+一页。

他们有一个专门的岗位,叫策划师。没错,你前面看到的,需求调研、资料检索,大纲规划,这事儿都归他们干。

他们最终会提供一个PPT草稿给到设计师,每页什么位置要放什么元素,用什么样的版式,全都固定好。

就像这样:

真正让AI去做PPT的时候,你也可以试试一样的处理。先让AI生成一个,不要各种复杂效果,简简单单,清清爽爽的页面初稿。

到后面再去加设计的效果:

我们做了大量测试,发现这套人类专家的工作流,AI完全能理解!策划部分负责版面规划,设计部分来做风格样式,跑下来的效果非常好。

你啥都不用干,等AI跑完这套流程就能用,甚至都不太需要改。

那当然,如果是一些特别重要的PPT,你也可以在策划稿阶段精调内容,再去让AI跑最终的设计,把效率和颜值都最大化。

4.用这个PPT技巧让AI跑设计。

我之前做PPT课程的时候,有一个可以给到“夯爆了”的PPT技巧,叫卡片式布局。

啥是卡片式布局呢,喏,你在苹果的发布会上经常能看到。把内容放进了一个个卡片里。

之前在论坛发了两篇文章,用的也是一样的卡片式布局的思路。

这样做有三大好处:

  1. 能装: 一页里能清晰地承载大量信息。
  2. 灵活: 卡片数量、大小、位置可以随意组合,版式变化无穷。
  3. AI能懂: 这是最关键的!我们发现,“卡片”是AI最容易理解和掌握的一种设计语言。

我们把这套方法论,写成了一段精确的指令,告诉AI如何像顶级设计师一样思考布局。这可以说是我们项目的核心壁垒之一,今天也一并分享了:

内容页的便当网格 (Bento Grid) 布局
这是一种灵活的网格系统,其布局应由内容本身的需求驱动,而非僵硬的模板。通过组合不同尺寸的卡片,创造出动态且视觉有趣的布局。
- 核心原则:
    - 灵活性: 卡片数量不固定。可以是 1, 2, 3, 4, 5 或更多个,取决于如何更好地呈现信息。
    - 层级感: 使用卡片尺寸建立视觉层级。最重要的信息放在最大的卡片上。
    - 留白: 在所有卡片之间保持至少 20px 的间距。
- 布局组合示例:
    - 单一焦点: 一张大卡片覆盖大部分区域 (w=1200, h=580)。适用于单一、有力的信息或详细的图表。
    - 两栏布局:
        - 50/50 对称: 两张等宽的卡片。
        - 非对称: 一张较宽的卡片(如 2/3 宽度)用于主内容,一张较窄的(1/3 宽度)用于辅助信息、数据或图片。
    - 三栏布局: 三张等宽的卡片,适合并列比较三项内容。
    - 主次结合: 一张大的居中卡片,两侧各一张小的垂直卡片。
    - 顶部英雄式: 顶部一张宽幅“英雄”卡片,下方是 2-4 个较小的等宽卡片网格。
    - 混合网格 (自由度最高): 自由混合各种尺寸的卡片,例如一个中等方块、两个小的水平矩形和一个垂直矩形。这种方式可以极大地适应不同内容的需求。

如果大家自己去跑也很简单,拿你刚刚用Grok检索到的内容结果,加上我下面这段提示词:

作为精通信息架构与 SVG 编码的专家,你的任务是将完整的文字内容转化为一张高质量、结构化、具备高级感、简洁感和专业感的 SVG 演示文稿页面。要求如下:

1.画布: SVG viewBox 必须是 0 0 1280 720。

2.内容页的便当网格 (Bento Grid) 布局
这是一种灵活的网格系统,其布局应由内容本身的需求驱动,而非僵硬的模板。通过组合不同尺寸的卡片,创造出动态且视觉有趣的布局。
- 核心原则:
    - 灵活性: 卡片数量不固定。可以是 1, 2, 3, 4, 5 或更多个,取决于如何更好地呈现信息。
    - 层级感: 使用卡片尺寸建立视觉层级。最重要的信息放在最大的卡片上。
    - 留白: 在所有卡片之间保持至少 20px 的间距。
- 布局组合示例:
    - 单一焦点: 一张大卡片覆盖大部分区域 (w=1200, h=580)。适用于单一、有力的信息或详细的图表。
    - 两栏布局:
        - 50/50 对称: 两张等宽的卡片。
        - 非对称: 一张较宽的卡片(如 2/3 宽度)用于主内容,一张较窄的(1/3 宽度)用于辅助信息、数据或图片。
    - 三栏布局: 三张等宽的卡片,适合并列比较三项内容。
    - 主次结合: 一张大的居中卡片,两侧各一张小的垂直卡片。
    - 顶部英雄式: 顶部一张宽幅“英雄”卡片,下方是 2-4 个较小的等宽卡片网格。
    - 混合网格 (自由度最高): 自由混合各种尺寸的卡片,例如一个中等方块、两个小的水平矩形和一个垂直矩形。这种方式可以极大地适应不同内容的需求。


请你根据我的内容输出SVG代码,我的内容是:

直接发送Gemini处理,我们用的是3 Flash,有条件可以直接上3.1 Pro:

它直接就能生成这样一整个页面的SVG代码了:

市面上的 AIPPT 大多是调用 Banana 或者生成 html,我们采用了生成整页 SVG 的方案。

SVG是一种PPT里兼容性最好的格式,生成的这个SVG代码你可以直接拖到Office 2016以上的版本里去做使用。

为什么选了这种SVG格式呢?说起来也是泪。

好处是可以导入 PPT,完全可编辑,甚至各种设计软件都支持,而且可以无限放大,保证清晰度。代价是,三个多月里我们花了大量时间处理 SVG,因为没人做过,一切都得从零开始,不断摸索。

如果你是自己使用,也不太需要可编辑性,我更推荐让AI生成HTML格式的,这个部分的提示词在之前的文章里有,感兴趣的佬友可以看看。


最后也想聊聊,为什么想把这个思路分享出来呢,特别是发的提示词已经是我们项目里用的。同事觉得我傻,不怕别人马上抄走吗。

那第一,我觉得,我现在做的这个东西,也只是挖掘了AI做PPT,大概5%的能力,我们还有非常多棒的思路,会去一一实现,这些对于PPT的理解和积累,是没办法复制的。

第二,我是真的不太服气。市面上这些AI PPT工具,他们的开发根本都不懂PPT。给个大纲,硬套模板,让很多人用完都说:AI PPT,也就这样了,不行。

不该是这样的。

我教了7年PPT,做了3年AI产品,我坚信,AI有能力也已经在改变我们制作和演示信息的方式。这些效果是现在我平衡成本和效果下,能跑出来的极限,但远远不是AI的极限。

我会持续在这里分享我的关于AI PPT的思考和探索,希望这些内容,能对同样在路上的你,有所帮助。

TOPIC OWNER
80 楼层
79 回复
67 用户
sandun poorops GalaxyMath arsenal4ever koast18
arsenal4ever
arsenal4ever
#4

直呼666.一年可能用不到一次PPT,但是做好看了,以后都得你做,所以,感谢佬的分享。我闪人。

HST
#6

最强的难道不是微软的copilot吗,ppt,word什么都能生成

hwang
hwang
#8

谢谢佬的分享。加入书签了

用svg 的话,也没办法解决编辑的问题吧?比如图上的150-170 ,想改字的话是直接改还是让AI 改svg 代码?

1个回复
GalaxyMath
GalaxyMath

导出后,在微软PPT里就能随意更改了,跟真正的PPT一样

↓ 跳到帖子
zzyang
zzyang
#9

大佬牛逼,收藏了。之后老板让我做PPT可以用上

belike
belike
#17

效果很好,除了思路,佬是否可以提供一些提示词或者skill什么的嘛

rick_w
rick_w
#18

图片怎么弄呢

1个回复
sandun
sandun 楼主

这是我们用卡片式设计的优势,就像搭乐高积木那样,规定好页面上有哪些卡片,卡片放什么位置后。卡片的形式,自由度是非常高的,可以放图片可以放图表,各种图示。规定好位置后用算法直接替换就可以

TOPIC OWNER
↓ 跳到帖子
MikuProfessor
MikuProfessor
#20

感谢分享,我相信垂类专业agent就应该楼主这样的专业人士去做。
不过这个方案好像没解决一个问题:
很多场景下不需要重新去设计模板,而是用现有模版。并且一些图标/配色/格式都是有规则或者习惯惯性要求的。所以需要AI对模版、风格等等做足够的分析,而不是单纯美观角度从零设计。
这个agent能解决这个场景么?我的感觉是这个场景还不少

2个回复
sandun
sandun 楼主

我可以私发你测测看奥,这部分我们也在做了

TOPIC OWNER
sandun
sandun 楼主

主要还是用卡片式这个布局模式去解决,让AI判断好模版的风格样式定位,那其实就像生产乐高积木,做好固定的样式和配色就可以。包括基于这个,可以进一步让Ai根据原页面内容重新生成,这个我们在做了,马上也会支持。

TOPIC OWNER
↓ 跳到帖子
zgl
zgl
#22

实在是好东西。工作中最痛恨的就是ppt,明明两句话一个word+markdown能说清楚的事情非要花里胡哨的。大部分人的ppt是没有power只有point

axyzyz
axyzyz
#24

666大佬还是厉害,刚好也在做PPT agent。学习到了;

arice
arice
#25

非常的需要,Ai ppt感觉需求要量确实有的。我在很多地方都碰到有人在问做PPT的话,哪家AI比较好。

sandun
sandun 楼主 ↶ @rick_w
#31

这是我们用卡片式设计的优势,就像搭乐高积木那样,规定好页面上有哪些卡片,卡片放什么位置后。卡片的形式,自由度是非常高的,可以放图片可以放图表,各种图示。规定好位置后用算法直接替换就可以

TOPIC OWNER
sandun
sandun 楼主 ↶ @MikuProfessor
#32

我可以私发你测测看奥,这部分我们也在做了

1个回复
memekoudai
memekoudai

请大佬私发一下,想试用试用。新老板来,经常需要做PPT

↓ 跳到帖子
TOPIC OWNER
g1331
g1331
#33

让我想到gemini网页对话里生成ppt的方式是否也是svg呢? :face_with_monocle:

1个回复
sandun
sandun 楼主

大部分现在用的都还是html的方案,包括Gemini,Kimi这些的,好处是效果会更好,因为AI天然对HTML前端设计的能力更强,SVG的话太缺语料了,目前我们跑下来这套流程也只有Gemini3,3.1 Pro可以做到很好的设计。如果自己用,不追求很强的编辑性,其实我觉得HTML也挺好的

TOPIC OWNER
↓ 跳到帖子
zahuo
zahuo
#34

佬的项目很棒。

我发现基本市面上所有ppt相关的agent都有一个待完善的地方,标题下面的解释说明文字真的真的太小了。
ppt一般都是需要在屏幕上讲解的,这个小字真的看不清楚。或者说文字方面还不够浓缩精简,亦或是其实一页的信息密度不需要这么多。

Lilis
#36

这个感觉很厉害呀,后面有工作需要的话按照佬这个思路试试

yuda_huo
yuda_huo
#38

牛逼啊佬,真是每次汇报做ppt都发愁,有了佬的帖子终于不用怕做ppt了!

sandun
sandun 楼主 ↶ @MikuProfessor
#39

主要还是用卡片式这个布局模式去解决,让AI判断好模版的风格样式定位,那其实就像生产乐高积木,做好固定的样式和配色就可以。包括基于这个,可以进一步让Ai根据原页面内容重新生成,这个我们在做了,马上也会支持。

TOPIC OWNER
Wangxiafeng
Wangxiafeng
#43

佬可以发出来体验一下吗

1个回复
sandun
sandun 楼主

怕被说是打广告哈哈 我私发你

TOPIC OWNER
↓ 跳到帖子
YeTongY
YeTongY
#47

这个效果真的不错,感谢大佬愿意分享思路

liqiongyu
liqiongyu
#50

太强了!这个就叫专业!

youka9169
youka9169
#54

这种高价值的设计思路能分享出来很可贵啊!授人以鱼不如授人以渔

RotosAries
RotosAries
#56

感谢佬的开源,后续正好可以用到,收藏了。

sandun
sandun 楼主 ↶ @g1331
#58

大部分现在用的都还是html的方案,包括Gemini,Kimi这些的,好处是效果会更好,因为AI天然对HTML前端设计的能力更强,SVG的话太缺语料了,目前我们跑下来这套流程也只有Gemini3,3.1 Pro可以做到很好的设计。如果自己用,不追求很强的编辑性,其实我觉得HTML也挺好的

TOPIC OWNER
zemicro
zemicro
#65

有一点非常认同,PPT还是以内容为主然后才是表现形式 :thinking:

JfanLiu
JfanLiu
#68

我本科大三软件工程课做的项目就是PPT Colipot,当时在PPTist上改json,模板预制。当时就有一腔热血做出来,但后面没被支持就没搞了。。。但常怀唏嘘和泪目。当时2023年,算全球第一个开源的AI PPT项目,两三百的star。
这几年来强力关注AI PPT发展,感觉还是html扩展性高一些。之前基于banana的生图ppt再ocr编辑也看过,感觉百花齐放了。
现在又有SVG的,SVG优势易编辑、llm善于生成、跨平台,很不错的技术选型!看到佬友能全链路,从数据调研,到内容处理,制作模版并填充,最终走通,做出很精美的结果就觉得很棒了!
大力关注!!!

1个回复
sandun
sandun 楼主

哈哈谢谢 目前确实是HTML的呈现和实现难度都是最优的 我们也在持续探索,争取做一个完善的SVG方案出来

TOPIC OWNER
↓ 跳到帖子
Wantu537
Wantu537
#70

想问一下佬, 输出整页可以加动画吗, 比如老师上课那种先给问题, 点一下再出答案, 生成的svg能加动画吗

1个回复
sandun
sandun 楼主

可以的 你也可以直接在PPT里面加,SVG放进PPT就是完全可编辑的元素了

TOPIC OWNER
↓ 跳到帖子
sandun
sandun 楼主 ↶ @JfanLiu
#72

哈哈谢谢 目前确实是HTML的呈现和实现难度都是最优的 我们也在持续探索,争取做一个完善的SVG方案出来

TOPIC OWNER
JfanLiu
JfanLiu
#78

我觉得可以先生成html,然后硬转svg。缺点费token,流程繁琐。还可以,先生图,再转svg。
prompt上,内容、风格、设计可以区分开。内容是每页不同的,风格是global的、fix的,设计根据每页内容来定制。
我觉得设计是现在比较重要的,也是能在一众ppt产品中出圈的。不同的内容的呈现方式是不同的,比如可以统计图、折线图这些图表,结构图的话就更多了。我觉得可以把研发重点放在激活设计创意上。

1个回复
sandun
sandun 楼主

这个我们有试过,先html再转svg,效果不是特别好的,html还有个问题就是边距的把握不是很好。我们后面方向大概是一方面内容的处理,我觉得这个还是很重要的,我们在研究一些好的搜索方案。一方面就是你说的图表图示这些了,这些在我们的架构下难度不是很大,会一点点去弄

TOPIC OWNER
↓ 跳到帖子
sandun
sandun 楼主 ↶ @JfanLiu
#79

这个我们有试过,先html再转svg,效果不是特别好的,html还有个问题就是边距的把握不是很好。我们后面方向大概是一方面内容的处理,我觉得这个还是很重要的,我们在研究一些好的搜索方案。一方面就是你说的图表图示这些了,这些在我们的架构下难度不是很大,会一点点去弄

TOPIC OWNER
alexWalker
#80

没想到在这还能看到良信,也是我们客户哈哈哈
佬友还是强,目前这个阶段我觉得还是业务经验+AI是最好去落地的场景,反之AI+XXX的大部分骗子