音乐、音效与对话
在 PonPon 上构建配音之外的整条音轨:生成音乐、设计音效、用变声重塑片段、为多人对话写脚本,并把各个声音层混在一起。
配音和配音译制是音频工作室里语音的那一面。本页讲其余的音轨部分——音乐、音效、变声和多人对话。要总览整个工作室,请从配音与音频基础开始。

音乐
在音乐模式(也有独立的 AI 音乐生成器)中生成一段背景音乐。提示一种风格与能量感,而不是某首具体的歌:
温暖的 lo-fi,放松,柔和的键盘音——用于平静的产品蒙太奇。
强劲的电子,激昂,有冲击力的低音——用于一支运动鞋广告。
- 当你不想让人声与配音抢戏时,切换到纯音乐。
- 设置时长来匹配你的剪辑。
提示
去描述*那种感觉和用途*("强劲的电子,激昂,用于运动鞋广告"),而不是点名某位艺人。点名某位艺人、某首歌或受版权保护的歌词,不仅是效果差一些——音乐模型会直接拒绝它。氛围加用途的提示词可靠地命中,也从不会触发过滤。
音效
在音效模式(或 AI 音效生成器)中描述一个声音——"铁皮屋顶上的暴雨""科幻感的门嗖嗖声""远处的城市车流"。你可以设置片段时长以及它对提示词的贴合严格程度。
在一段片段下叠加音效,能让一段无声的成片鲜活起来——脚步声、环境声,或在一个切点上的一记点睛音。
变声
已经有一段录音了?变声会用另一种语音重新演绎它,同时保留你的时机和表达——很适合匿名化或重塑旁白风格。还有一个降噪选项,可以先清理一下粗糙的源素材。
对话
对话模式会生成一段多人对话:逐行写脚本,并给每个说话者分配不同的语音(共有 37 种语音可选)。适合小品、一问一答的讲解和角色场景。
混合各个声音层
一段完整的混音通常会叠起三样东西,从最响到最轻:
- 人声——一段配音或对话音轨,是最响的元素,也是观众跟随的那一条。
- 音乐——铺在下面的一层,纯音乐且明显更轻,以免它和人声抢戏。
- 音效——增添质感的点睛声和环境声,是其中最轻的。
逐个生成它们,然后在 Flow 或 Studio 中对照你的画面把它们拼装、平衡好。
注意