首幀錨定
你上傳的圖像成為影片的精確首幀。Kling 3.0 不會重新詮釋或近似你的圖像——它逐像素使用你的圖像作為起點,並從中生成運動。這意味著你的美術指導、色彩分級和構圖都完整保留。
圖轉影片(i2v)生成接收單張靜態圖像,產出一個影片片段,使該圖像的內容以運動的方式活躍起來。輸入圖像成為首幀(或關鍵參考幀),模型生成後續幀,在添加運動的同時保持與來源圖像的視覺一致性——人物行走、頭髮飄動、水面蕩漾、鏡頭橫移。挑戰在於在幀間保持身份和精細細節(特定臉孔、襯衫上的標誌、精確的色調)不出現漂移或變形偽影。
你上傳的圖像成為影片的精確首幀。Kling 3.0 不會重新詮釋或近似你的圖像——它逐像素使用你的圖像作為起點,並從中生成運動。這意味著你的美術指導、色彩分級和構圖都完整保留。
來源圖像中的臉部、標誌、文字和獨特圖案在生成的影片中始終保持一致。Kling 3.0 的時序注意力機制在每一幀都交叉參考來源圖像以防止身份漂移——第 150 幀的臉部與第 1 幀的臉部完全一致。
調整 Kling 3.0 添加到場景中的運動量。低強度:微妙的呼吸、輕柔的風、輕微的鏡頭漂移。中等:行走、轉身、適度的環境運動。高強度:奔跑、動態鏡頭掃描、戲劇性動作。滑桿讓你擁有導演級的能量控制。
在文字提示詞中描述你想要的運動:「她轉身看向身後」、「鏡頭緩慢推進」、「樹葉從左到右飄落」。Kling 3.0 遵循這些運動指令,同時保持來源圖像的內容不變。
Kling 3.0 自動偵測並匹配你輸入圖像的長寬比——1:1、16:9、9:16、4:3、3:4 等。無需裁切或調整來源圖像大小以適應固定的影片格式。輸出影片匹配輸入尺寸。
從單張圖像生成 5 到 15 秒的影片。如需更長的序列,在 Flow 中串聯多個生成,使用一個片段的最後一幀作為下一個的首幀以保持連續性。
前往 PonPon 圖轉影片,從模型下拉選單中選擇 Kling 3.0。
拖放或點擊上傳你想要動畫化的圖像。使用高解析度圖像(最長邊至少 1024px)以取得最佳效果。Kling 3.0 接受 JPEG、PNG 和 WebP 格式。
描述你想要的運動——而非場景本身(模型可以從你的圖像中看到)。專注於動作:「女子緩慢微笑並微微歪頭」、「鏡頭後拉揭示全景」、「海浪拍打岩石」。控制在 1-2 句話。
調整運動強度滑桿(低/中/高)並選擇影片時長(5 秒、10 秒或 15 秒)。較低強度配合較短時長對保留精細細節更安全。較高強度配合較長時長產生更戲劇性的結果,但可能出現輕微漂移。
點擊 生成 並檢查結果。檢查身份、文字和精細細節是否在全程保持。如果運動太微妙,增加強度重新生成。如果細節在漂移,降低強度或縮短時長。
無論你是獨立創作者、設計團隊還是品牌方,每個模型都能適應你的工作方式。
She slowly looks up from the book and smiles. A gentle breeze moves her hair. Warm afternoon light shifts slightly as a cloud passes.
模型:Kling 3.0 · 時長:8 秒 · 運動強度:中 · 來源:人像照片
Camera slowly orbits 45 degrees around the product. Soft reflections move across the surface. Background stays softly blurred.
模型:Kling 3.0 · 時長:6 秒 · 運動強度:低 · 來源:白底產品圖
Clouds drift slowly across the sky. Water in the lake ripples gently. Camera holds steady. Birds fly across the distant mountains.
模型:Kling 3.0 · 時長:15 秒 · 運動強度:低 · 來源:風景照片
The warrior swings the sword in a wide arc. Sparks fly from the blade. Camera follows the motion with a slight pan right. Cape billows dramatically.
模型:Kling 3.0 · 時長:5 秒 · 運動強度:高 · 來源:數位插畫
將現有的產品照片轉化為社群廣告的短影片片段。一張靜態產品照變成 6 秒的緩慢推進和微妙環境運動影片——無需重新拍攝、無需 3D 建模、無需 After Effects。從現有照片庫中批量產出影片變體。
藝術家和插畫師為社群媒體動畫化其靜態作品。一幅森林數位畫獲得輕柔的風、飄落的樹葉和變化的光線。一幅角色肖像眨眼和呼吸。Instagram 和 TikTok 上動畫貼文比靜態圖像獲得 2-3 倍更多的互動。
將房地產攝影轉化為漫遊式影片片段。一張廣角室內照變成平滑的鏡頭橫移,揭示整個房間。為每個房間生成 6 秒片段,在 Flow 中串聯,僅從靜態照片即可建立完整的物業參觀。
電影製作人和動畫師將分鏡幀轉化為粗略的動畫序列。每個繪製的幀變成 5-10 秒的動畫片段,展示分鏡筆記中描述的鏡頭運動和角色動作。在幾小時而非幾週內產出可用的動態預覽。
| Kling 3.0 圖轉影片 | 其他圖轉影片模型 | |
|---|---|---|
| 身份保持 | 像素級錨定首幀 + 時序交叉注意力——15 秒內漂移極少 | Sora 2:效果好但 8 秒後精細細節可能漂移。Veo 3.1:表現強但偶有顏色改變。Seedance 2.0:人臉可靠,文字/標誌較弱 |
| 運動控制 | 強度滑桿 + 文字提示詞指定運動方向,可用運動畫筆精確繪製路徑 | Sora 2:僅文字提示詞。Veo 3.1:基礎強度控制。Seedance 2.0:文字提示詞 + 有限強度選項 |
| 最長時長 | 每次生成最長 15 秒 | Sora 2:最長 20 秒。Veo 3.1:最長 8 秒。Seedance 2.0:最長 10 秒 |
| 畫幅比例靈活性 | 自動匹配輸入圖像畫幅,支援任意標準比例 | 大多數模型僅支援 16:9、9:16、1:1,自訂比例可能需要裁切 |
| 音訊輸出 | 內建原生音訊生成(環境音和對話) | Sora 2:無原生音訊。Veo 3.1:內建原生音訊。Seedance 2.0:音樂同步但對話有限 |
至少 1024x1024 像素的輸入圖像會產出明顯更好的影片品質。低解析度來源圖像(低於 512px)可能導致輸出模糊、偽影嚴重。如果圖像較小,先使用 PonPon 的圖像工具進行放大,再轉化為影片。
模型已經看到你的圖像——它不需要場景描述。撰寫描述運動的提示詞:「她向左轉」、「鏡頭推進」、「雨開始下了」。場景描述(「一位穿紅裙的女子在花園中」)浪費了提示詞容量,可能導致模型重新詮釋你的圖像。
如果你的圖像包含必須保持完整的文字、標誌或精細圖案,使用低運動強度。高運動強度會增加細節漂移的可能。你隨時可以在下次生成中增加強度,如果結果太靜態的話。
Kling 3.0 將影片比例與你的圖像匹配。如果你的圖像是 4:3 但你需要 TikTok 的 9:16,先裁切圖像而非依賴模型重新構圖。有意識的裁切讓你控制畫面內容。
加入數千名每天使用 PonPon 的創作者、設計團隊和品牌方。