AI 媒體術語表

為你在 PonPon 上會遇到的 AI 圖片、影片和音訊術語提供樸素的定義——從長寬比和局部重繪，到對嘴、原生音訊、額度和文字生影片。

AI 媒體的詞彙，用樸素的說法解釋。每一條都連結到講得更深的那篇指南。

A–C

額度（Allowance）——你方案內含的點數，每個週期刷新一次；會優先於其餘一切被消耗。參見點數與方案。

長寬比（Aspect ratio）——畫面的形狀（16:9、9:16、1:1）。逐個輸出選擇；參見輸出格式與限制。

批次（Batch）——一次生成好幾張圖片，從中挑出最好的。參見輸出格式與限制。

點數（Credits）——你每次生成所花費的東西；費用取決於模型、長度和解析度。參見點數與方案。

D–L

降噪（Denoise）——在重新配音之前，清理音訊源中的背景噪音。參見音樂、音效與對話。

配音轉譯（Dubbing）——把現有的音訊或影片翻譯並重新配音成另一種語言。參見 AI 配音轉譯。

特效（Effect）——一個把照片變成主題片段的一鍵範本。參見一鍵特效。

圖庫（Gallery）——你生成的成果匯集之處，可以複用、編輯或帶入另一個工具。參見圖片生成基礎。

訪客（Guest）——登入之前的瀏覽；你可以探索但無法生成。參見帳號與登入。

圖片生影片（Image-to-video）——讓你提供的一張靜態圖動起來。參見圖片生影片指南。

局部重繪（Inpainting，標註編輯）——只重新生成一張圖片中標記出的某個區域。參見標註編輯與參考圖片。

純音樂（Instrumental）——生成的無人聲音樂，這樣它能墊在配音之下。參見音樂、音效與對話。

對嘴（Lip-sync）——讓一個角色的嘴部匹配一段音軌。參見會說話的虛擬人與對嘴。

M–R

模型（Model）——負責生成的引擎；每個各有不同的強項。參見如何選擇模型。

運動筆刷（Motion brush）——塗出鏡頭中應發生運動的區域，以實現更精細的掌控。參見 Kling 3.0 運動筆刷。

運動控制（Motion control）——用一段參考影片的運動去驅動一個靜態角色。參見文字生影片基礎。

多鏡頭（Multi-shot）——在一次影片生成中產出好幾個鏡頭切換。參見 Kling 3.0 多鏡頭和影片提示詞寫作。

原生音訊（Native audio）——由一個有音訊能力的影片模型把聲音和畫面一起生成出來，比如 Veo 3.1 原生音訊。參見如何選擇模型。

留白（Negative space）——在一張圖片中留出的空曠區域，通常用於之後放置文字。參見圖片提示詞寫作。

提示詞（Prompt）——引導一次生成的文字描述。參見圖片提示詞寫作和影片提示詞寫作。

佇列（Queue）——負載高時的一小段等待；Pro 檔位享有優先權。參見生成疑難排解。

參考圖片（Reference image）——一張附上的圖片，用於引導風格、主體或構圖；用 @ 提及某一張。參見標註編輯與參考圖片。

參考圖生影片（Reference-to-video）——把一個主體或風格從參考媒體帶入一段生成的片段。參見文字生影片基礎。

解析度（Resolution）——輸出的像素尺寸（例如圖片的 1K–4K）；取決於模型。參見輸出格式與限制。

獎勵點數（Reward credits）——可能會過期的贈送點數；在你的額度之後、加值之前被消耗。參見點數與方案。

S–Z

起始 / 結束幀（Start / end frame）——一段影片的第一張（並可選地最後一張）圖片；模型以它為起點讓畫面動起來。參見圖片生影片指南。

文字生圖（Text-to-image）——從一段書面描述生成一張圖片。參見圖片生成基礎。

文字生影片（Text-to-video）——從一段書面描述生成一段片段。參見什麼是文字生影片 AI？。

放大（Upscaling）——提升一張現有圖片或影片的解析度和細節。參見編輯與清理工具。

變聲（Voice changer）——用另一種語音重新演繹一段錄音，同時保留原本的時機。參見音樂、音效與對話。

配音（Voiceover，文字轉語音）——從一段腳本生成口語音訊。參見配音與音訊基礎。

找不到某個術語？FAQ 涵蓋了常見的問題。

AI 媒體術語表

為你在 PonPon 上會遇到的 AI 圖片、影片和音訊術語提供樸素的定義——從長寬比和局部重繪，到對嘴、原生音訊、額度和文字生影片。

AI 媒體的詞彙，用樸素的說法解釋。每一條都連結到講得更深的那篇指南。

A–C

額度（Allowance）——你方案內含的點數，每個週期刷新一次；會優先於其餘一切被消耗。參見點數與方案。

長寬比（Aspect ratio）——畫面的形狀（16:9、9:16、1:1）。逐個輸出選擇；參見輸出格式與限制。

批次（Batch）——一次生成好幾張圖片，從中挑出最好的。參見輸出格式與限制。

點數（Credits）——你每次生成所花費的東西；費用取決於模型、長度和解析度。參見點數與方案。

D–L

降噪（Denoise）——在重新配音之前，清理音訊源中的背景噪音。參見音樂、音效與對話。

配音轉譯（Dubbing）——把現有的音訊或影片翻譯並重新配音成另一種語言。參見 AI 配音轉譯。

特效（Effect）——一個把照片變成主題片段的一鍵範本。參見一鍵特效。

圖庫（Gallery）——你生成的成果匯集之處，可以複用、編輯或帶入另一個工具。參見圖片生成基礎。

訪客（Guest）——登入之前的瀏覽；你可以探索但無法生成。參見帳號與登入。

圖片生影片（Image-to-video）——讓你提供的一張靜態圖動起來。參見圖片生影片指南。

局部重繪（Inpainting，標註編輯）——只重新生成一張圖片中標記出的某個區域。參見標註編輯與參考圖片。

純音樂（Instrumental）——生成的無人聲音樂，這樣它能墊在配音之下。參見音樂、音效與對話。

對嘴（Lip-sync）——讓一個角色的嘴部匹配一段音軌。參見會說話的虛擬人與對嘴。

M–R

模型（Model）——負責生成的引擎；每個各有不同的強項。參見如何選擇模型。

運動筆刷（Motion brush）——塗出鏡頭中應發生運動的區域，以實現更精細的掌控。參見 Kling 3.0 運動筆刷。

運動控制（Motion control）——用一段參考影片的運動去驅動一個靜態角色。參見文字生影片基礎。

多鏡頭（Multi-shot）——在一次影片生成中產出好幾個鏡頭切換。參見 Kling 3.0 多鏡頭和影片提示詞寫作。

原生音訊（Native audio）——由一個有音訊能力的影片模型把聲音和畫面一起生成出來，比如 Veo 3.1 原生音訊。參見如何選擇模型。

留白（Negative space）——在一張圖片中留出的空曠區域，通常用於之後放置文字。參見圖片提示詞寫作。

提示詞（Prompt）——引導一次生成的文字描述。參見圖片提示詞寫作和影片提示詞寫作。

佇列（Queue）——負載高時的一小段等待；Pro 檔位享有優先權。參見生成疑難排解。

參考圖片（Reference image）——一張附上的圖片，用於引導風格、主體或構圖；用 @ 提及某一張。參見標註編輯與參考圖片。

參考圖生影片（Reference-to-video）——把一個主體或風格從參考媒體帶入一段生成的片段。參見文字生影片基礎。

解析度（Resolution）——輸出的像素尺寸（例如圖片的 1K–4K）；取決於模型。參見輸出格式與限制。

獎勵點數（Reward credits）——可能會過期的贈送點數；在你的額度之後、加值之前被消耗。參見點數與方案。

S–Z

起始 / 結束幀（Start / end frame）——一段影片的第一張（並可選地最後一張）圖片；模型以它為起點讓畫面動起來。參見圖片生影片指南。

文字生圖（Text-to-image）——從一段書面描述生成一張圖片。參見圖片生成基礎。

文字生影片（Text-to-video）——從一段書面描述生成一段片段。參見什麼是文字生影片 AI？。

放大（Upscaling）——提升一張現有圖片或影片的解析度和細節。參見編輯與清理工具。

變聲（Voice changer）——用另一種語音重新演繹一段錄音，同時保留原本的時機。參見音樂、音效與對話。

配音（Voiceover，文字轉語音）——從一段腳本生成口語音訊。參見配音與音訊基礎。

找不到某個術語？FAQ 涵蓋了常見的問題。

AI 媒體術語表

A–C

D–L

M–R

S–Z

相關文章

AI 媒體術語表

A–C

D–L

M–R

S–Z

相關文章