Viết prompt cho video
Phương pháp thực tiễn để viết prompt video AI trên PonPon: cấu trúc cảnh quay, các lệnh camera mà mô hình hiểu được, nhịp độ, mẹo theo từng mô hình, và cách khắc phục lỗi thường gặp.
Một prompt video tốt đọc lên như một mô tả cảnh quay mà đạo diễn giao cho người quay phim. Nó nêu rõ chủ thể, hành động, góc máy và ánh sáng — và tránh nhồi nhét ba cảnh vào một.
Cấu trúc đáng tin cậy
Viết theo thứ tự này:
- Chủ thể — ai hoặc cái gì, cụ thể. "Một cô gái trẻ mặc áo mưa đỏ."
- Hành động — điều duy nhất thay đổi trong clip. "bước về phía máy quay và ngước nhìn lên."
- Bối cảnh — ở đâu, xung quanh có gì. "trên con phố thành thị ướt át về đêm, ánh đèn neon phản chiếu dưới vũng nước."
- Máy quay — chuyển động. "dolly chậm vào, ngang tầm mắt."
- Ánh sáng & không khí — "ánh sáng xanh lạnh, điện ảnh, u ám."
Một cô gái trẻ mặc áo mưa đỏ bước về phía máy quay và ngước nhìn lên, trên con phố thành thị ướt át về đêm với ánh đèn neon phản chiếu, dolly chậm vào ngang tầm mắt, ánh sáng điện ảnh lạnh. 9:16, 5 giây.
Ngôn ngữ camera mà mô hình hiểu
Timeline Studio của PonPon hiển thị chính xác các chuyển động camera mà mô hình phản hồi — dùng các từ khóa này trong bất kỳ prompt nào:
- Push In / Pull Out — di chuyển về phía hoặc ra xa chủ thể.
- Pan Left / Right, Tilt Up / Down — xoay máy quay tại chỗ.
- Tracking — theo dõi cạnh bên một chủ thể đang di chuyển.
- Orbit — quay vòng quanh chủ thể.
- Crane Up, Aerial — nâng lên cao hơn cảnh.
- Handheld — chuyển động tự do, hữu cơ.
- Dolly Zoom — hiệu ứng chóng mặt.
- Static — góc máy cố định.
Mỗi cảnh chỉ một hành động
Lỗi phổ biến nhất là mô tả cả một cảnh với nhiều sự kiện. Một clip chỉ kéo dài vài giây — hãy cho nó một nhịp duy nhất. Nếu bạn cần một chuỗi cảnh, hãy tạo từng cảnh riêng lẻ rồi ghép trong Flow, hoặc dùng timeline nhiều cảnh trong Studio trên Kling 3.0 để chỉ đạo nhiều cắt cảnh trong một lần tạo.
Nhịp độ và độ dài
- Giữ clip ngắn khi còn đang thử nghiệm; đánh giá chuyển động trước, rồi mới render dài hơn.
- Các từ như "chậm", "thong thả", "nhẹ nhàng" so với "nhanh", "dứt khoát", "năng động" thực sự tạo ra sự khác biệt trong kết quả.
Chọn mô hình phù hợp với cảnh quay
- Veo 3.1 — điều khiển camera chính xác nhất, cộng thêm âm thanh gốc. Chọn khi chuyển động máy quay là yếu tố quan trọng.
- Kling 3.0 — tốt nhất cho hội thoại (đồng bộ môi) và chuỗi nhiều cảnh.
- Sora 2 — khi vật lý và chất liệu thực tế là điểm nhấn của cảnh.
- Seedance 2.0 — nhanh, biểu cảm, phù hợp cho clip mạng xã hội dọc.
Khắc phục các vấn đề thường gặp
| Vấn đề | Hãy thử cách này |
|---|---|
| Khuôn mặt hoặc bàn tay bị méo | Hành động đơn giản hơn, chuyển động chậm hơn, hoặc bắt đầu từ ảnh rõ nét qua image-to-video |
| Camera bỏ qua hướng của bạn | Chỉ nêu một chuyển động rõ ràng từ danh sách trên; bỏ các hướng xung đột |
| Quá nhiều thứ xảy ra | Cắt xuống còn một hành động; chia thành nhiều cảnh |
| Phong cách không như ý | Cung cấp Start Frame thay vì mô tả phong cách bằng lời |
| Nhấn mạnh sai chủ thể | Đặt chủ thể lên đầu; loại bỏ bối cảnh rườm rà |
Cố định phong cách bằng khung hình đầu tiên
Khi *phong cách* quan trọng hơn sự bất ngờ, hãy tạo hoặc tải lên một ảnh tĩnh và tạo chuyển động với Start Frame trong trình tạo video. Bạn không còn phải đánh cược vào phong cách nữa, chỉ cần yêu cầu mô hình xử lý chuyển động. Để xem lại những kiến thức cơ bản, hãy xem Kiến thức cơ bản về text-to-video.
Bài viết liên quan
- Cơ bản tạo video từ văn bảnCách tạo video hoạt động trên PonPon: tạo video từ văn bản so với tạo video từ ảnh, chọn mô hình như Veo 3.1, Sora 2 và Kling 3.0, cùng các tab Chỉnh sửa và Kiểm soát chuyển động.
- Video AI đầu tiênHướng dẫn từng bước: đăng nhập, viết prompt, chọn mô hình, đặt tỷ lệ khung hình, thời lượng và độ phân giải, tạo video và tải xuống video AI đầu tiên trên PonPon.
- Cơ bản tạo ảnh AIViết prompt ảnh hiệu quả, lựa chọn mô hình phù hợp như GPT Image 2, Nano Banana Pro và Seedream 5.0, sử dụng ảnh tham chiếu, và chỉnh sửa kết quả bằng các công cụ chú thích.