影片提示詞寫作
一套實用的 PonPon AI 影片提示詞方法:鏡頭結構、模型能理解的鏡頭預設、節奏、各模型專屬技巧,以及修復常見失敗。
一條好的影片提示詞,讀起來就像導演遞給攝影師的一段鏡頭說明。它寫明主體、動作、鏡頭和光線——並克制住把三個鏡頭塞進一個的衝動。
一套可靠的結構
按這個順序來寫:
- 主體——是誰或是什麼,要具體。「一位穿紅色雨衣的年輕女子。」
- 動作——片段中唯一變化的那件事。「朝鏡頭走來並抬頭仰望。」
- 場景——在哪裡,周圍有什麼。「在夜晚一條被雨水浸濕的城市街道上,霓虹倒映在水窪裡。」
- 鏡頭——運鏡。「緩慢推近,平視視角。」
- 光線與氛圍——「冷藍色光,電影感,情緒化。」
一位穿紅色雨衣的年輕女子朝鏡頭走來並抬頭仰望,在夜晚一條被雨水浸濕、有霓虹倒影的城市街道上,平視緩慢推近,冷調電影感光線。9:16,5 秒。
模型能理解的鏡頭語言
PonPon 的 Studio 時間軸暴露了模型確實會回應的那些鏡頭運動——在任何提示詞裡都可以使用這些術語:
- Push In / Pull Out(推近 / 拉遠)——朝主體靠近或遠離。
- Pan Left / Right(左 / 右搖)、Tilt Up / Down(上 / 下俯仰)——鏡頭原地旋轉。
- Tracking(跟拍)——沿著移動的主體並行跟隨。
- Orbit(環繞)——繞著主體轉圈。
- Crane Up(升降臂上升)、Aerial(空拍)——升到場景上方。
- Handheld(手持)——鬆散、有機的運動。
- Dolly Zoom(移焦變焦)——眩暈效果。
- Static(固定鏡頭)——鎖死的機位。
提示
每段片段只指明一個主要運鏡。一次性要求「又搖又推又環繞」通常只會得到一團糊——模型在幾秒內無法兼顧三個方向。
一個鏡頭一個動作
最常見的錯誤是用多個事件描述一整個場景。一段片段只有幾秒——給它一個節拍。如果你需要一個序列,就把每個鏡頭分別生成,再在 Flow 中拼接,或在 Kling 3.0 上用 Studio 的多鏡頭時間軸在一次生成中調度多個切換。
注意
提示詞有一個長度上限(依模型而異),而 PonPon 不會替你裁剪一條過長的提示詞——它會直接失敗,而非執行。把要點放在最前面;指明一個清晰的節拍,勝過一味堆砌細節。
節奏與長度
- 迭代時把片段保持短一些;先判斷運動,再投入更長的算繪。
- 「緩慢」「從容」「輕柔」對比「快速」「俐落」「充滿活力」這類詞,確實會改變結果。
讓模型比對鏡頭
- Veo 3.1——最精準的鏡頭調度,外加原生音訊。當運鏡很關鍵時選它。
- Kling 3.0——最適合對話(對嘴)和多鏡頭序列。
- Sora 2——當物理表現和材質真實感是鏡頭的支柱時。
- Seedance 2.0——快速、有表現力、直式優先的社群短片。
注意
一套有效的提示詞結構可以跨模型遷移——同一段鏡頭說明在任何模型上都能跑。在兩三個模型上試同一條提示詞、留下最好的那條,而不是為每個模型重寫。
修復常見問題
| 問題 | 試試這樣做 |
|---|---|
| 人臉或手部扭曲 | 更簡單的動作、更慢的運動,或透過圖片生影片從一張乾淨的圖片開始 |
| 鏡頭無視你的指令 | 從上面的列表裡指明一個明確的運鏡;去掉相互衝突的指令 |
| 畫面裡發生的事太多 | 收斂到單個動作;拆成多個鏡頭 |
| 風格跑偏 | 提供一張 Start frame 起始幀,而不是用文字描述風格 |
| 主體強調錯位 | 把主體放在最前面;移除背景雜物 |
用首幀鎖定畫面
當*風格*比驚喜更重要時,生成或上傳一張靜態圖,並在影片生成器裡用 Start frame 起始幀讓它動起來。你不再為畫面效果碰運氣,只讓模型負責處理運動。想了解基礎知識,請重溫文字生影片基礎。