音乐、音效与对话

在 PonPon 上构建配音之外的整条音轨：生成音乐、设计音效、用变声重塑片段、为多人对话写脚本，并把各个声音层混在一起。

配音和配音译制是音频工作室里语音的那一面。本页讲其余的音轨部分——音乐、音效、变声和多人对话。要总览整个工作室，请从配音与音频基础开始。

音乐

在音乐模式（也有独立的 AI 音乐生成器）中生成一段背景音乐。提示一种风格与能量感，而不是某首具体的歌：

温暖的 lo-fi，放松，柔和的键盘音——用于平静的产品蒙太奇。

强劲的电子，激昂，有冲击力的低音——用于一支运动鞋广告。

当你不想让人声与配音抢戏时，切换到纯音乐。
设置时长来匹配你的剪辑。

提示

去描述*那种感觉和用途*（"强劲的电子，激昂，用于运动鞋广告"），而不是点名某位艺人。点名某位艺人、某首歌或受版权保护的歌词，不仅是效果差一些——音乐模型会直接拒绝它。氛围加用途的提示词可靠地命中，也从不会触发过滤。

音效

在音效模式（或 AI 音效生成器）中描述一个声音——"铁皮屋顶上的暴雨""科幻感的门嗖嗖声""远处的城市车流"。你可以设置片段时长以及它对提示词的贴合严格程度。

在一段片段下叠加音效，能让一段无声的成片鲜活起来——脚步声、环境声，或在一个切点上的一记点睛音。

变声

已经有一段录音了？变声会用另一种语音重新演绎它，同时保留你的时机和表达——很适合匿名化或重塑旁白风格。还有一个降噪选项，可以先清理一下粗糙的源素材。

对话

对话模式会生成一段多人对话：逐行写脚本，并给每个说话者分配不同的语音（共有 37 种语音可选）。适合小品、一问一答的讲解和角色场景。

混合各个声音层

一段完整的混音通常会叠起三样东西，从最响到最轻：

人声——一段配音或对话音轨，是最响的元素，也是观众跟随的那一条。
音乐——铺在下面的一层，纯音乐且明显更轻，以免它和人声抢戏。
音效——增添质感的点睛声和环境声，是其中最轻的。

逐个生成它们，然后在 Flow 或 Studio 中对照你的画面把它们拼装、平衡好。

注意

对于简单的片段，你可以完全跳过单独的音频环节：用一个原生带音频的视频模型来生成，比如 Veo 3.1 或 Kling 3.0，它们会把画面和声音一起产出——参见带音频的 AI 视频用例。

音乐、音效与对话

在 PonPon 上构建配音之外的整条音轨：生成音乐、设计音效、用变声重塑片段、为多人对话写脚本，并把各个声音层混在一起。

音乐

在音乐模式（也有独立的 AI 音乐生成器）中生成一段背景音乐。提示一种风格与能量感，而不是某首具体的歌：

温暖的 lo-fi，放松，柔和的键盘音——用于平静的产品蒙太奇。

强劲的电子，激昂，有冲击力的低音——用于一支运动鞋广告。

当你不想让人声与配音抢戏时，切换到纯音乐。
设置时长来匹配你的剪辑。

提示

音效

在一段片段下叠加音效，能让一段无声的成片鲜活起来——脚步声、环境声，或在一个切点上的一记点睛音。

变声

对话

对话模式会生成一段多人对话：逐行写脚本，并给每个说话者分配不同的语音（共有 37 种语音可选）。适合小品、一问一答的讲解和角色场景。

混合各个声音层

一段完整的混音通常会叠起三样东西，从最响到最轻：

人声——一段配音或对话音轨，是最响的元素，也是观众跟随的那一条。
音乐——铺在下面的一层，纯音乐且明显更轻，以免它和人声抢戏。
音效——增添质感的点睛声和环境声，是其中最轻的。

逐个生成它们，然后在 Flow 或 Studio 中对照你的画面把它们拼装、平衡好。

注意

音乐、音效与对话

音乐

音效

变声

对话

混合各个声音层

相关文章

音乐、音效与对话

音乐

音效

变声

对话

混合各个声音层

相关文章