AI 媒体术语表
用大白话解释你在 PonPon 上会遇到的 AI 图片、视频和音频术语——从宽高比、局部重绘到对口型、原生音频、额度和文生视频。
用大白话讲清 AI 媒体的词汇。每个词条都链接到讲得更深入的那篇指南。
A–C
额度(Allowance)——你套餐包含的、每个周期刷新的积分;优先于其他一切被消耗。参见积分与套餐。
宽高比(Aspect ratio)——画面的形状(16:9、9:16、1:1)。按每个输出来挑选;参见输出格式与限制。
批量(Batch)——一次生成多张图片以便挑出最好的。参见输出格式与限制。
积分(Credits)——你每次生成所花费的;费用取决于模型、时长和分辨率。参见积分与套餐。
D–L
降噪(Denoise)——在重新配音前,从音频源中清理背景噪音。参见音乐、音效与对话。
配音译制(Dubbing)——把现有的音频或视频翻译并重新配音成另一种语言。参见 AI 配音译制。
特效(Effect)——一个把照片变成主题短片的一键模板。参见一键 Effects。
图库(Gallery)——你生成的结果汇集之处,可供复用、编辑或带入另一个工具。参见图片生成基础。
访客(Guest)——登录之前的浏览状态;你可以探索,但无法生成。参见账号与登录。
图生视频(Image-to-video)——让你提供的一张静态图动起来。参见图生视频指南。
局部重绘(Inpainting,标注编辑)——只重新生成一张图片中被标记的区域。参见标注编辑与参考图片。
纯音乐(Instrumental)——生成的无人声音乐,可以铺在配音之下。参见音乐、音效与对话。
对口型(Lip-sync)——让一个角色的嘴部匹配一段音轨。参见数字人说话与对口型。
M–R
模型(Model)——负责生成的引擎;每个都有不同的强项。参见如何选择模型。
运动笔刷(Motion brush)——在一个镜头上涂出应当发生运动的区域,以做更精细的控制。参见 Kling 3.0 运动笔刷。
运动控制(Motion control)——用一段参考视频的运动去驱动一张静态角色图。参见文生视频基础。
多镜头(Multi-shot)——在一次视频生成中产出多个镜头切换。参见 Kling 3.0 多镜头和视频提示词写作。
原生音频(Native audio)——由一个带音频能力的视频模型与画面一起生成的声音,例如 Veo 3.1 原生音频。参见如何选择模型。
留白(Negative space)——图片中留出的空白区域,常用于之后放置文字。参见图片提示词写作。
提示词(Prompt)——引导一次生成的文字描述。参见图片提示词写作和视频提示词写作。
队列(Queue)——高负载时的一小段等待;Pro 档享有优先级。参见排查生成问题。
参考图片(Reference image)——一张用来引导风格、主体或构图的附加图片;用 @ 提及它。参见标注编辑与参考图片。
参考图生视频(Reference-to-video)——把某个主体或风格从参考素材带入一段生成的片段。参见文生视频基础。
分辨率(Resolution)——输出的像素尺寸(例如图片的 1K–4K);取决于模型。参见输出格式与限制。
奖励积分(Reward credits)——可能会过期的奖励积分;在额度之后、充值之前被消耗。参见积分与套餐。
S–Z
起始 / 结束帧(Start / end frame)——一段视频的第一张(以及可选的最后一张)图片;模型从它开始让画面动起来。参见图生视频指南。
文生图(Text-to-image)——从一段书面描述生成一张图片。参见图片生成基础。
文生视频(Text-to-video)——从一段书面描述生成一段片段。参见什么是文生视频 AI?。
放大(Upscaling)——提升一张现有图片或视频的分辨率和细节。参见编辑与清理工具。
变声(Voice changer)——用另一种语音重新演绎一段录音,同时保留原本的时机。参见音乐、音效与对话。
配音(Voiceover,文字转语音)——从一段脚本生成口语音频。参见配音与音频基础。
找不到某个词?FAQ 覆盖了常见问题。