AI 媒體術語表
為你在 PonPon 上會遇到的 AI 圖片、影片和音訊術語提供樸素的定義——從長寬比和局部重繪,到對嘴、原生音訊、額度和文字生影片。
AI 媒體的詞彙,用樸素的說法解釋。每一條都連結到講得更深的那篇指南。
A–C
額度(Allowance)——你方案內含的點數,每個週期刷新一次;會優先於其餘一切被消耗。參見點數與方案。
長寬比(Aspect ratio)——畫面的形狀(16:9、9:16、1:1)。逐個輸出選擇;參見輸出格式與限制。
批次(Batch)——一次生成好幾張圖片,從中挑出最好的。參見輸出格式與限制。
點數(Credits)——你每次生成所花費的東西;費用取決於模型、長度和解析度。參見點數與方案。
D–L
降噪(Denoise)——在重新配音之前,清理音訊源中的背景噪音。參見音樂、音效與對話。
配音轉譯(Dubbing)——把現有的音訊或影片翻譯並重新配音成另一種語言。參見 AI 配音轉譯。
特效(Effect)——一個把照片變成主題片段的一鍵範本。參見一鍵特效。
圖庫(Gallery)——你生成的成果匯集之處,可以複用、編輯或帶入另一個工具。參見圖片生成基礎。
訪客(Guest)——登入之前的瀏覽;你可以探索但無法生成。參見帳號與登入。
圖片生影片(Image-to-video)——讓你提供的一張靜態圖動起來。參見圖片生影片指南。
局部重繪(Inpainting,標註編輯)——只重新生成一張圖片中標記出的某個區域。參見標註編輯與參考圖片。
純音樂(Instrumental)——生成的無人聲音樂,這樣它能墊在配音之下。參見音樂、音效與對話。
對嘴(Lip-sync)——讓一個角色的嘴部匹配一段音軌。參見會說話的虛擬人與對嘴。
M–R
模型(Model)——負責生成的引擎;每個各有不同的強項。參見如何選擇模型。
運動筆刷(Motion brush)——塗出鏡頭中應發生運動的區域,以實現更精細的掌控。參見 Kling 3.0 運動筆刷。
運動控制(Motion control)——用一段參考影片的運動去驅動一個靜態角色。參見文字生影片基礎。
多鏡頭(Multi-shot)——在一次影片生成中產出好幾個鏡頭切換。參見 Kling 3.0 多鏡頭和影片提示詞寫作。
原生音訊(Native audio)——由一個有音訊能力的影片模型把聲音和畫面一起生成出來,比如 Veo 3.1 原生音訊。參見如何選擇模型。
留白(Negative space)——在一張圖片中留出的空曠區域,通常用於之後放置文字。參見圖片提示詞寫作。
提示詞(Prompt)——引導一次生成的文字描述。參見圖片提示詞寫作和影片提示詞寫作。
佇列(Queue)——負載高時的一小段等待;Pro 檔位享有優先權。參見生成疑難排解。
參考圖片(Reference image)——一張附上的圖片,用於引導風格、主體或構圖;用 @ 提及某一張。參見標註編輯與參考圖片。
參考圖生影片(Reference-to-video)——把一個主體或風格從參考媒體帶入一段生成的片段。參見文字生影片基礎。
解析度(Resolution)——輸出的像素尺寸(例如圖片的 1K–4K);取決於模型。參見輸出格式與限制。
獎勵點數(Reward credits)——可能會過期的贈送點數;在你的額度之後、加值之前被消耗。參見點數與方案。
S–Z
起始 / 結束幀(Start / end frame)——一段影片的第一張(並可選地最後一張)圖片;模型以它為起點讓畫面動起來。參見圖片生影片指南。
文字生圖(Text-to-image)——從一段書面描述生成一張圖片。參見圖片生成基礎。
文字生影片(Text-to-video)——從一段書面描述生成一段片段。參見什麼是文字生影片 AI?。
放大(Upscaling)——提升一張現有圖片或影片的解析度和細節。參見編輯與清理工具。
變聲(Voice changer)——用另一種語音重新演繹一段錄音,同時保留原本的時機。參見音樂、音效與對話。
配音(Voiceover,文字轉語音)——從一段腳本生成口語音訊。參見配音與音訊基礎。
找不到某個術語?FAQ 涵蓋了常見的問題。