Viết prompt cho video

Phương pháp thực tiễn để viết prompt video AI trên PonPon: cấu trúc cảnh quay, các lệnh camera mà mô hình hiểu được, nhịp độ, mẹo theo từng mô hình, và cách khắc phục lỗi thường gặp.

Một prompt video tốt đọc lên như một mô tả cảnh quay mà đạo diễn giao cho người quay phim. Nó nêu rõ chủ thể, hành động, góc máy và ánh sáng — và tránh nhồi nhét ba cảnh vào một.

Cấu trúc đáng tin cậy

Viết theo thứ tự này:

Chủ thể — ai hoặc cái gì, cụ thể. "Một cô gái trẻ mặc áo mưa đỏ."
Hành động — điều duy nhất thay đổi trong clip. "bước về phía máy quay và ngước nhìn lên."
Bối cảnh — ở đâu, xung quanh có gì. "trên con phố thành thị ướt át về đêm, ánh đèn neon phản chiếu dưới vũng nước."
Máy quay — chuyển động. "dolly chậm vào, ngang tầm mắt."
Ánh sáng & không khí — "ánh sáng xanh lạnh, điện ảnh, u ám."

Một cô gái trẻ mặc áo mưa đỏ bước về phía máy quay và ngước nhìn lên, trên con phố thành thị ướt át về đêm với ánh đèn neon phản chiếu, dolly chậm vào ngang tầm mắt, ánh sáng điện ảnh lạnh. 9:16, 5 giây.

Ngôn ngữ camera mà mô hình hiểu

Timeline Studio của PonPon hiển thị chính xác các chuyển động camera mà mô hình phản hồi — dùng các từ khóa này trong bất kỳ prompt nào:

Push In / Pull Out — di chuyển về phía hoặc ra xa chủ thể.
Pan Left / Right, Tilt Up / Down — xoay máy quay tại chỗ.
Tracking — theo dõi cạnh bên một chủ thể đang di chuyển.
Orbit — quay vòng quanh chủ thể.
Crane Up, Aerial — nâng lên cao hơn cảnh.
Handheld — chuyển động tự do, hữu cơ.
Dolly Zoom — hiệu ứng chóng mặt.
Static — góc máy cố định.

Mẹo

Chỉ nêu một chuyển động chính mỗi clip. Yêu cầu "pan và zoom và orbit" cùng lúc thường cho kết quả lộn xộn — mô hình không thể xử lý ba hướng trong vài giây.

Mỗi cảnh chỉ một hành động

Lỗi phổ biến nhất là mô tả cả một cảnh với nhiều sự kiện. Một clip chỉ kéo dài vài giây — hãy cho nó một nhịp duy nhất. Nếu bạn cần một chuỗi cảnh, hãy tạo từng cảnh riêng lẻ rồi ghép trong Flow, hoặc dùng timeline nhiều cảnh trong Studio trên Kling 3.0 để chỉ đạo nhiều cắt cảnh trong một lần tạo.

Lưu ý

Prompt có giới hạn độ dài tối đa (thay đổi theo từng mô hình), và PonPon sẽ không tự cắt bớt prompt quá dài — nó sẽ báo lỗi thay vì chạy. Hãy đặt phần quan trọng nhất lên đầu; một nhịp rõ ràng hiệu quả hơn là chất chồng quá nhiều chi tiết.

Nhịp độ và độ dài

Giữ clip ngắn khi còn đang thử nghiệm; đánh giá chuyển động trước, rồi mới render dài hơn.
Các từ như "chậm", "thong thả", "nhẹ nhàng" so với "nhanh", "dứt khoát", "năng động" thực sự tạo ra sự khác biệt trong kết quả.

Chọn mô hình phù hợp với cảnh quay

Veo 3.1 — điều khiển camera chính xác nhất, cộng thêm âm thanh gốc. Chọn khi chuyển động máy quay là yếu tố quan trọng.
Kling 3.0 — tốt nhất cho hội thoại (đồng bộ môi) và chuỗi nhiều cảnh.
Sora 2 — khi vật lý và chất liệu thực tế là điểm nhấn của cảnh.
Seedance 2.0 — nhanh, biểu cảm, phù hợp cho clip mạng xã hội dọc.

Lưu ý

Cấu trúc prompt hoạt động được có thể dùng chung cho các mô hình — cùng một mô tả cảnh có thể chạy trên bất kỳ mô hình nào. Hãy thử một prompt trên hai hoặc ba mô hình và giữ lại kết quả tốt nhất thay vì viết lại cho từng mô hình.

Khắc phục các vấn đề thường gặp

Vấn đề	Hãy thử cách này
Khuôn mặt hoặc bàn tay bị méo	Hành động đơn giản hơn, chuyển động chậm hơn, hoặc bắt đầu từ ảnh rõ nét qua image-to-video
Camera bỏ qua hướng của bạn	Chỉ nêu một chuyển động rõ ràng từ danh sách trên; bỏ các hướng xung đột
Quá nhiều thứ xảy ra	Cắt xuống còn một hành động; chia thành nhiều cảnh
Phong cách không như ý	Cung cấp Start Frame thay vì mô tả phong cách bằng lời
Nhấn mạnh sai chủ thể	Đặt chủ thể lên đầu; loại bỏ bối cảnh rườm rà

Cố định phong cách bằng khung hình đầu tiên

Khi *phong cách* quan trọng hơn sự bất ngờ, hãy tạo hoặc tải lên một ảnh tĩnh và tạo chuyển động với Start Frame trong trình tạo video. Bạn không còn phải đánh cược vào phong cách nữa, chỉ cần yêu cầu mô hình xử lý chuyển động. Để xem lại những kiến thức cơ bản, hãy xem Kiến thức cơ bản về text-to-video.

Viết prompt cho video

Cấu trúc đáng tin cậy

Viết theo thứ tự này:

Chủ thể — ai hoặc cái gì, cụ thể. "Một cô gái trẻ mặc áo mưa đỏ."
Hành động — điều duy nhất thay đổi trong clip. "bước về phía máy quay và ngước nhìn lên."
Bối cảnh — ở đâu, xung quanh có gì. "trên con phố thành thị ướt át về đêm, ánh đèn neon phản chiếu dưới vũng nước."
Máy quay — chuyển động. "dolly chậm vào, ngang tầm mắt."
Ánh sáng & không khí — "ánh sáng xanh lạnh, điện ảnh, u ám."

Một cô gái trẻ mặc áo mưa đỏ bước về phía máy quay và ngước nhìn lên, trên con phố thành thị ướt át về đêm với ánh đèn neon phản chiếu, dolly chậm vào ngang tầm mắt, ánh sáng điện ảnh lạnh. 9:16, 5 giây.

Ngôn ngữ camera mà mô hình hiểu

Timeline Studio của PonPon hiển thị chính xác các chuyển động camera mà mô hình phản hồi — dùng các từ khóa này trong bất kỳ prompt nào:

Push In / Pull Out — di chuyển về phía hoặc ra xa chủ thể.
Pan Left / Right, Tilt Up / Down — xoay máy quay tại chỗ.
Tracking — theo dõi cạnh bên một chủ thể đang di chuyển.
Orbit — quay vòng quanh chủ thể.
Crane Up, Aerial — nâng lên cao hơn cảnh.
Handheld — chuyển động tự do, hữu cơ.
Dolly Zoom — hiệu ứng chóng mặt.
Static — góc máy cố định.

Mẹo

Mỗi cảnh chỉ một hành động

Lưu ý

Nhịp độ và độ dài

Giữ clip ngắn khi còn đang thử nghiệm; đánh giá chuyển động trước, rồi mới render dài hơn.
Các từ như "chậm", "thong thả", "nhẹ nhàng" so với "nhanh", "dứt khoát", "năng động" thực sự tạo ra sự khác biệt trong kết quả.

Chọn mô hình phù hợp với cảnh quay

Veo 3.1 — điều khiển camera chính xác nhất, cộng thêm âm thanh gốc. Chọn khi chuyển động máy quay là yếu tố quan trọng.
Kling 3.0 — tốt nhất cho hội thoại (đồng bộ môi) và chuỗi nhiều cảnh.
Sora 2 — khi vật lý và chất liệu thực tế là điểm nhấn của cảnh.
Seedance 2.0 — nhanh, biểu cảm, phù hợp cho clip mạng xã hội dọc.

Lưu ý

Khắc phục các vấn đề thường gặp

Vấn đề	Hãy thử cách này
Khuôn mặt hoặc bàn tay bị méo	Hành động đơn giản hơn, chuyển động chậm hơn, hoặc bắt đầu từ ảnh rõ nét qua image-to-video
Camera bỏ qua hướng của bạn	Chỉ nêu một chuyển động rõ ràng từ danh sách trên; bỏ các hướng xung đột
Quá nhiều thứ xảy ra	Cắt xuống còn một hành động; chia thành nhiều cảnh
Phong cách không như ý	Cung cấp Start Frame thay vì mô tả phong cách bằng lời
Nhấn mạnh sai chủ thể	Đặt chủ thể lên đầu; loại bỏ bối cảnh rườm rà

Viết prompt cho video

Cấu trúc đáng tin cậy

Ngôn ngữ camera mà mô hình hiểu

Mỗi cảnh chỉ một hành động

Nhịp độ và độ dài

Chọn mô hình phù hợp với cảnh quay

Khắc phục các vấn đề thường gặp

Cố định phong cách bằng khung hình đầu tiên

Bài viết liên quan

Viết prompt cho video

Cấu trúc đáng tin cậy

Ngôn ngữ camera mà mô hình hiểu

Mỗi cảnh chỉ một hành động

Nhịp độ và độ dài

Chọn mô hình phù hợp với cảnh quay

Khắc phục các vấn đề thường gặp

Cố định phong cách bằng khung hình đầu tiên

Bài viết liên quan