从头到尾做一条 TikTok 短视频
一个带真实提示词的完整实战示例:策划一条竖屏短视频、生成画面、加上配音和音乐、把它拼装起来并导出——全程使用 PonPon。
这是一份完整的配方——从空白页面到一条可发布的竖屏短视频——它把其他几篇指南串在了一起。我们会做一条无真人出镜的产品短片,发到 TikTok / Reels,但同样的步骤适用于任何短视频。

策划这条短片
- 格式: 竖屏 9:16,每个镜头几秒,总共 2–4 个镜头。
- 钩子: 定下第一秒。开场镜头必须让人停下刷动的手指。
- 每个镜头一个节拍: 每个镜头只放一个动作——别把一整个场景塞进一个片段。
我们的例子:一条 3 个镜头的可重复使用水杯短片——*开箱 → 使用中 → 主视觉镜头。*
第 1 步——生成画面
在视频生成器里设为 9:16,逐个镜头来做。这个例子的真实提示词:
镜头 1(钩子): *一只手把一个哑光绿色水杯从牛皮纸盒里拿出来,置于阳光洒落的厨房台面上,缓慢推近,清亮的晨光。9:16,3 秒。*
镜头 2: *同一个水杯正在水龙头下接水,水花飞溅,浅景深,明亮清新。9:16,3 秒。*
镜头 3(主视觉): *这个水杯立在户外一块长满青苔的石头上,缓慢环绕,黄金时刻。9:16,4 秒。*
Seedance 2.0 快速且竖屏优先;Veo 3.1 给你最强的镜头控制。在寻找镜头的阶段,把早期渲染保持短一些、用默认分辨率,等定下要保留的镜头后再投入。参见如何选择模型和视频提示词写作。有真实的产品照片?把它放进 Start Frame 起始帧——参见图生视频指南。
第 2 步——加上人声和音乐
在音频工作室里:
- 一段利落的配音:*"既好用又好看的补水方式。认识一下这只你永远不会弄丢的水杯。"*
- 一层音乐铺底:*"温暖、轻快的独立流行,轻量打击乐"*——纯音乐,压低在人声之下。
- 几个音效——开盒声、倒水声——增添质感。
提示
用一个原生带音频的模型(如 Veo 3.1)来生成画面,就能省去单独的音频环节——它会随片段一起产出同步的声音,所以简单的镜头无需另做混音。
第 3 步——拼装
在 Flow 中把这三个镜头排好序、把音频铺在下面,或在 Studio 中搭建一个多场景剪辑。把每个镜头修剪到它的节拍上,并确保钩子排在最前面。
第 4 步——导出并发布
导出 9:16 的 MP4。上传时加上平台内字幕——大多数观众静音观看,所以第一行文字和钩子镜头一样重要。
捷径
想一步到位拿到成片?一个一键 Effect 能把一张照片变成一段主题竖屏视频,无需任何设置——非常适合潮流风格的帖子。