AI 媒体术语表

用大白话解释你在 PonPon 上会遇到的 AI 图片、视频和音频术语——从宽高比、局部重绘到对口型、原生音频、额度和文生视频。

用大白话讲清 AI 媒体的词汇。每个词条都链接到讲得更深入的那篇指南。

A–C

额度（Allowance）——你套餐包含的、每个周期刷新的积分；优先于其他一切被消耗。参见积分与套餐。

宽高比（Aspect ratio）——画面的形状（16:9、9:16、1:1）。按每个输出来挑选；参见输出格式与限制。

批量（Batch）——一次生成多张图片以便挑出最好的。参见输出格式与限制。

积分（Credits）——你每次生成所花费的；费用取决于模型、时长和分辨率。参见积分与套餐。

D–L

降噪（Denoise）——在重新配音前，从音频源中清理背景噪音。参见音乐、音效与对话。

配音译制（Dubbing）——把现有的音频或视频翻译并重新配音成另一种语言。参见 AI 配音译制。

特效（Effect）——一个把照片变成主题短片的一键模板。参见一键 Effects。

图库（Gallery）——你生成的结果汇集之处，可供复用、编辑或带入另一个工具。参见图片生成基础。

访客（Guest）——登录之前的浏览状态；你可以探索，但无法生成。参见账号与登录。

图生视频（Image-to-video）——让你提供的一张静态图动起来。参见图生视频指南。

局部重绘（Inpainting，标注编辑）——只重新生成一张图片中被标记的区域。参见标注编辑与参考图片。

纯音乐（Instrumental）——生成的无人声音乐，可以铺在配音之下。参见音乐、音效与对话。

对口型（Lip-sync）——让一个角色的嘴部匹配一段音轨。参见数字人说话与对口型。

M–R

模型（Model）——负责生成的引擎；每个都有不同的强项。参见如何选择模型。

运动笔刷（Motion brush）——在一个镜头上涂出应当发生运动的区域，以做更精细的控制。参见 Kling 3.0 运动笔刷。

运动控制（Motion control）——用一段参考视频的运动去驱动一张静态角色图。参见文生视频基础。

多镜头（Multi-shot）——在一次视频生成中产出多个镜头切换。参见 Kling 3.0 多镜头和视频提示词写作。

原生音频（Native audio）——由一个带音频能力的视频模型与画面一起生成的声音，例如 Veo 3.1 原生音频。参见如何选择模型。

留白（Negative space）——图片中留出的空白区域，常用于之后放置文字。参见图片提示词写作。

提示词（Prompt）——引导一次生成的文字描述。参见图片提示词写作和视频提示词写作。

队列（Queue）——高负载时的一小段等待；Pro 档享有优先级。参见排查生成问题。

参考图片（Reference image）——一张用来引导风格、主体或构图的附加图片；用 @ 提及它。参见标注编辑与参考图片。

参考图生视频（Reference-to-video）——把某个主体或风格从参考素材带入一段生成的片段。参见文生视频基础。

分辨率（Resolution）——输出的像素尺寸（例如图片的 1K–4K）；取决于模型。参见输出格式与限制。

奖励积分（Reward credits）——可能会过期的奖励积分；在额度之后、充值之前被消耗。参见积分与套餐。

S–Z

起始 / 结束帧（Start / end frame）——一段视频的第一张（以及可选的最后一张）图片；模型从它开始让画面动起来。参见图生视频指南。

文生图（Text-to-image）——从一段书面描述生成一张图片。参见图片生成基础。

文生视频（Text-to-video）——从一段书面描述生成一段片段。参见什么是文生视频 AI？。

放大（Upscaling）——提升一张现有图片或视频的分辨率和细节。参见编辑与清理工具。

变声（Voice changer）——用另一种语音重新演绎一段录音，同时保留原本的时机。参见音乐、音效与对话。

配音（Voiceover，文字转语音）——从一段脚本生成口语音频。参见配音与音频基础。

找不到某个词？FAQ 覆盖了常见问题。

AI 媒体术语表

用大白话解释你在 PonPon 上会遇到的 AI 图片、视频和音频术语——从宽高比、局部重绘到对口型、原生音频、额度和文生视频。

用大白话讲清 AI 媒体的词汇。每个词条都链接到讲得更深入的那篇指南。

A–C

额度（Allowance）——你套餐包含的、每个周期刷新的积分；优先于其他一切被消耗。参见积分与套餐。

宽高比（Aspect ratio）——画面的形状（16:9、9:16、1:1）。按每个输出来挑选；参见输出格式与限制。

批量（Batch）——一次生成多张图片以便挑出最好的。参见输出格式与限制。

积分（Credits）——你每次生成所花费的；费用取决于模型、时长和分辨率。参见积分与套餐。

D–L

降噪（Denoise）——在重新配音前，从音频源中清理背景噪音。参见音乐、音效与对话。

配音译制（Dubbing）——把现有的音频或视频翻译并重新配音成另一种语言。参见 AI 配音译制。

特效（Effect）——一个把照片变成主题短片的一键模板。参见一键 Effects。

图库（Gallery）——你生成的结果汇集之处，可供复用、编辑或带入另一个工具。参见图片生成基础。

访客（Guest）——登录之前的浏览状态；你可以探索，但无法生成。参见账号与登录。

图生视频（Image-to-video）——让你提供的一张静态图动起来。参见图生视频指南。

局部重绘（Inpainting，标注编辑）——只重新生成一张图片中被标记的区域。参见标注编辑与参考图片。

纯音乐（Instrumental）——生成的无人声音乐，可以铺在配音之下。参见音乐、音效与对话。

对口型（Lip-sync）——让一个角色的嘴部匹配一段音轨。参见数字人说话与对口型。

M–R

模型（Model）——负责生成的引擎；每个都有不同的强项。参见如何选择模型。

运动笔刷（Motion brush）——在一个镜头上涂出应当发生运动的区域，以做更精细的控制。参见 Kling 3.0 运动笔刷。

运动控制（Motion control）——用一段参考视频的运动去驱动一张静态角色图。参见文生视频基础。

多镜头（Multi-shot）——在一次视频生成中产出多个镜头切换。参见 Kling 3.0 多镜头和视频提示词写作。

原生音频（Native audio）——由一个带音频能力的视频模型与画面一起生成的声音，例如 Veo 3.1 原生音频。参见如何选择模型。

留白（Negative space）——图片中留出的空白区域，常用于之后放置文字。参见图片提示词写作。

提示词（Prompt）——引导一次生成的文字描述。参见图片提示词写作和视频提示词写作。

队列（Queue）——高负载时的一小段等待；Pro 档享有优先级。参见排查生成问题。

参考图片（Reference image）——一张用来引导风格、主体或构图的附加图片；用 @ 提及它。参见标注编辑与参考图片。

参考图生视频（Reference-to-video）——把某个主体或风格从参考素材带入一段生成的片段。参见文生视频基础。

分辨率（Resolution）——输出的像素尺寸（例如图片的 1K–4K）；取决于模型。参见输出格式与限制。

奖励积分（Reward credits）——可能会过期的奖励积分；在额度之后、充值之前被消耗。参见积分与套餐。

S–Z

起始 / 结束帧（Start / end frame）——一段视频的第一张（以及可选的最后一张）图片；模型从它开始让画面动起来。参见图生视频指南。

文生图（Text-to-image）——从一段书面描述生成一张图片。参见图片生成基础。

文生视频（Text-to-video）——从一段书面描述生成一段片段。参见什么是文生视频 AI？。

放大（Upscaling）——提升一张现有图片或视频的分辨率和细节。参见编辑与清理工具。

变声（Voice changer）——用另一种语音重新演绎一段录音，同时保留原本的时机。参见音乐、音效与对话。

配音（Voiceover，文字转语音）——从一段脚本生成口语音频。参见配音与音频基础。

找不到某个词？FAQ 覆盖了常见问题。

AI 媒体术语表

A–C

D–L

M–R

S–Z

相关文章

AI 媒体术语表

A–C

D–L

M–R

S–Z

相关文章