影片提示詞寫作

一套實用的 PonPon AI 影片提示詞方法：鏡頭結構、模型能理解的鏡頭預設、節奏、各模型專屬技巧，以及修復常見失敗。

一條好的影片提示詞，讀起來就像導演遞給攝影師的一段鏡頭說明。它寫明主體、動作、鏡頭和光線——並克制住把三個鏡頭塞進一個的衝動。

一套可靠的結構

按這個順序來寫：

主體——是誰或是什麼，要具體。「一位穿紅色雨衣的年輕女子。」
動作——片段中唯一變化的那件事。「朝鏡頭走來並抬頭仰望。」
場景——在哪裡，周圍有什麼。「在夜晚一條被雨水浸濕的城市街道上，霓虹倒映在水窪裡。」
鏡頭——運鏡。「緩慢推近，平視視角。」
光線與氛圍——「冷藍色光，電影感，情緒化。」

一位穿紅色雨衣的年輕女子朝鏡頭走來並抬頭仰望，在夜晚一條被雨水浸濕、有霓虹倒影的城市街道上，平視緩慢推近，冷調電影感光線。9:16，5 秒。

模型能理解的鏡頭語言

PonPon 的 Studio 時間軸暴露了模型確實會回應的那些鏡頭運動——在任何提示詞裡都可以使用這些術語：

Push In / Pull Out（推近 / 拉遠）——朝主體靠近或遠離。
Pan Left / Right（左 / 右搖）、Tilt Up / Down（上 / 下俯仰）——鏡頭原地旋轉。
Tracking（跟拍）——沿著移動的主體並行跟隨。
Orbit（環繞）——繞著主體轉圈。
Crane Up（升降臂上升）、Aerial（空拍）——升到場景上方。
Handheld（手持）——鬆散、有機的運動。
Dolly Zoom（移焦變焦）——眩暈效果。
Static（固定鏡頭）——鎖死的機位。

提示

每段片段只指明一個主要運鏡。一次性要求「又搖又推又環繞」通常只會得到一團糊——模型在幾秒內無法兼顧三個方向。

一個鏡頭一個動作

最常見的錯誤是用多個事件描述一整個場景。一段片段只有幾秒——給它一個節拍。如果你需要一個序列，就把每個鏡頭分別生成，再在 Flow 中拼接，或在 Kling 3.0 上用 Studio 的多鏡頭時間軸在一次生成中調度多個切換。

注意

提示詞有一個長度上限（依模型而異），而 PonPon 不會替你裁剪一條過長的提示詞——它會直接失敗，而非執行。把要點放在最前面；指明一個清晰的節拍，勝過一味堆砌細節。

節奏與長度

迭代時把片段保持短一些；先判斷運動，再投入更長的算繪。
「緩慢」「從容」「輕柔」對比「快速」「俐落」「充滿活力」這類詞，確實會改變結果。

讓模型比對鏡頭

Veo 3.1——最精準的鏡頭調度，外加原生音訊。當運鏡很關鍵時選它。
Kling 3.0——最適合對話（對嘴）和多鏡頭序列。
Sora 2——當物理表現和材質真實感是鏡頭的支柱時。
Seedance 2.0——快速、有表現力、直式優先的社群短片。

注意

一套有效的提示詞結構可以跨模型遷移——同一段鏡頭說明在任何模型上都能跑。在兩三個模型上試同一條提示詞、留下最好的那條，而不是為每個模型重寫。

修復常見問題

問題	試試這樣做
人臉或手部扭曲	更簡單的動作、更慢的運動，或透過圖片生影片從一張乾淨的圖片開始
鏡頭無視你的指令	從上面的列表裡指明一個明確的運鏡；去掉相互衝突的指令
畫面裡發生的事太多	收斂到單個動作；拆成多個鏡頭
風格跑偏	提供一張 Start frame 起始幀，而不是用文字描述風格
主體強調錯位	把主體放在最前面；移除背景雜物

用首幀鎖定畫面

當*風格*比驚喜更重要時，生成或上傳一張靜態圖，並在影片生成器裡用 Start frame 起始幀讓它動起來。你不再為畫面效果碰運氣，只讓模型負責處理運動。想了解基礎知識，請重溫文字生影片基礎。

影片提示詞寫作

一套實用的 PonPon AI 影片提示詞方法：鏡頭結構、模型能理解的鏡頭預設、節奏、各模型專屬技巧，以及修復常見失敗。

一條好的影片提示詞，讀起來就像導演遞給攝影師的一段鏡頭說明。它寫明主體、動作、鏡頭和光線——並克制住把三個鏡頭塞進一個的衝動。

一套可靠的結構

按這個順序來寫：

主體——是誰或是什麼，要具體。「一位穿紅色雨衣的年輕女子。」
動作——片段中唯一變化的那件事。「朝鏡頭走來並抬頭仰望。」
場景——在哪裡，周圍有什麼。「在夜晚一條被雨水浸濕的城市街道上，霓虹倒映在水窪裡。」
鏡頭——運鏡。「緩慢推近，平視視角。」
光線與氛圍——「冷藍色光，電影感，情緒化。」

一位穿紅色雨衣的年輕女子朝鏡頭走來並抬頭仰望，在夜晚一條被雨水浸濕、有霓虹倒影的城市街道上，平視緩慢推近，冷調電影感光線。9:16，5 秒。

模型能理解的鏡頭語言

PonPon 的 Studio 時間軸暴露了模型確實會回應的那些鏡頭運動——在任何提示詞裡都可以使用這些術語：

Push In / Pull Out（推近 / 拉遠）——朝主體靠近或遠離。
Pan Left / Right（左 / 右搖）、Tilt Up / Down（上 / 下俯仰）——鏡頭原地旋轉。
Tracking（跟拍）——沿著移動的主體並行跟隨。
Orbit（環繞）——繞著主體轉圈。
Crane Up（升降臂上升）、Aerial（空拍）——升到場景上方。
Handheld（手持）——鬆散、有機的運動。
Dolly Zoom（移焦變焦）——眩暈效果。
Static（固定鏡頭）——鎖死的機位。

提示

每段片段只指明一個主要運鏡。一次性要求「又搖又推又環繞」通常只會得到一團糊——模型在幾秒內無法兼顧三個方向。

一個鏡頭一個動作

注意

節奏與長度

迭代時把片段保持短一些；先判斷運動，再投入更長的算繪。
「緩慢」「從容」「輕柔」對比「快速」「俐落」「充滿活力」這類詞，確實會改變結果。

讓模型比對鏡頭

Veo 3.1——最精準的鏡頭調度，外加原生音訊。當運鏡很關鍵時選它。
Kling 3.0——最適合對話（對嘴）和多鏡頭序列。
Sora 2——當物理表現和材質真實感是鏡頭的支柱時。
Seedance 2.0——快速、有表現力、直式優先的社群短片。

注意

修復常見問題

問題	試試這樣做
人臉或手部扭曲	更簡單的動作、更慢的運動，或透過圖片生影片從一張乾淨的圖片開始
鏡頭無視你的指令	從上面的列表裡指明一個明確的運鏡；去掉相互衝突的指令
畫面裡發生的事太多	收斂到單個動作；拆成多個鏡頭
風格跑偏	提供一張 Start frame 起始幀，而不是用文字描述風格
主體強調錯位	把主體放在最前面；移除背景雜物

影片提示詞寫作

一套可靠的結構

模型能理解的鏡頭語言

一個鏡頭一個動作

節奏與長度

讓模型比對鏡頭

修復常見問題

用首幀鎖定畫面

相關文章

影片提示詞寫作

一套可靠的結構

模型能理解的鏡頭語言

一個鏡頭一個動作

節奏與長度

讓模型比對鏡頭

修復常見問題

用首幀鎖定畫面

相關文章