Viết prompt cho hình ảnh
Phương pháp thực tế để viết prompt hình ảnh AI trên PonPon: cấu trúc đáng tin cậy, cách nâng cấp prompt từ yếu lên mạnh, từ vựng về phong cách và ánh sáng mà các mô hình hiểu, tham chiếu ảnh, và cách khắc phục sự cố.
Một prompt hình ảnh tốt đọc như một bản tóm tắt bạn sẽ đưa cho nhiếp ảnh gia hoặc họa sĩ minh họa: những gì trong khung hình, phong cách, cách bố cục, và ánh sáng như thế nào. Bao quát đủ bốn yếu tố đó và bạn sẽ nhận được hình ảnh có thể dùng được thường xuyên hơn nhiều so với khi dùng một từ đơn lẻ.

Cấu trúc đáng tin cậy
Viết theo thứ tự này — nó phản ánh cách một cảnh quay thực sự được lên kế hoạch:
- Chủ thể — những gì trong khung hình, cụ thể. “Một chiếc cốc cà phê gốm trên một chiếc khăn linen.”
- Phong cách — chất liệu và cách xử lý. “Ảnh sản phẩm editorial,” “minh họa vector phẳng,” “render 3D,” “màu nước.”
- Bố cục — khung hình và góc độ. “Cận cảnh, từ trên xuống, căn giữa, độ sâu trường ảnh nông.”
- Ánh sáng & Cảm xúc — “Ánh sáng buổi sáng dịu nhẹ,” “đêm neon,” “softbox studio, high-key.”
Ảnh sản phẩm editorial của hộp tai nghe không dây màu đen mờ trên bề mặt đá ướt, từ trên xuống, độ sâu trường ảnh nông, ánh sáng studio khuếch tán dịu nhẹ, tối giản, tông màu lạnh.
Từ yếu lên mạnh
Cùng một ý tưởng, được cải thiện bằng cách thêm độ cụ thể về chủ thể, rồi phong cách, rồi ánh sáng:
| Prompt | Kết quả |
|---|---|
| “a coffee cup” | Một chiếc cốc chung chung, phong cách và ánh sáng ngẫu nhiên |
| “a ceramic coffee cup on a linen napkin” | Đúng chủ thể, nhưng phẳng và thiếu phong cách |
| “editorial photo of a ceramic coffee cup on a linen napkin, close-up” | Bố cục đúng ý |
| “editorial photo of a ceramic coffee cup on a linen napkin, close-up, soft morning window light, shallow depth of field” | Bức ảnh bạn thực sự muốn |
Mỗi mệnh đề thêm vào loại bỏ một quyết định mà mô hình sẽ tự đưa ra cho bạn.
Từ vựng mà các mô hình hiểu
Hãy dùng các thuật ngữ cụ thể thay vì các tính từ mơ hồ — các mô hình ánh xạ những từ này với các mẫu thị giác thực tế:
- Chất liệu — photo, illustration, 3D render, oil painting, line art, isometric, claymation.
- Cỡ cảnh & ống kính — close-up, wide shot, macro, top-down, eye-level, 35mm, bokeh, fisheye.
- Ánh sáng — golden hour, backlit, rim light, softbox, hard shadow, high-key, low-key.
- Cảm xúc / Bảng màu — muted pastels, high-contrast, monochrome, warm tones, cinematic.
Nói điều bạn muốn, không phải điều bạn không muốn
Các mô hình xử lý mô tả tích cực tốt hơn nhiều so với phủ định. Hãy yêu cầu “một chiếc bàn làm việc trống, tối giản,” không phải “một chiếc bàn không có gì trên đó.” Nếu bạn sẽ thêm văn bản hoặc logo lên trên sau này, hãy prompt cho không gian âm — “lots of empty sky above” — thay vì mô tả những gì không nên có ở đó.
Làm việc với ảnh tham chiếu
Đính kèm tối đa 10 ảnh tham chiếu để định hướng phong cách, bố cục, hoặc một chủ thể cụ thể. Trong khi viết prompt, gõ @ để trỏ đến một ảnh đính kèm cụ thể:
Put @Image1 on the table in @Image2, matching the lighting of @Image2.
Đây là cách rõ ràng nhất để kết hợp nhiều tham chiếu vào một cảnh quay — xem Chú thích chỉnh sửa & ảnh tham chiếu để biết quy trình tham chiếu và chỉnh sửa đầy đủ.
Khớp prompt với mô hình
Cùng một prompt hoạt động được trên các mô hình, nhưng mỗi mô hình thưởng cho một sự nhấn mạnh hơi khác nhau:
- GPT Image 2 — viết rõ bất kỳ văn bản trong ảnh nào, trong dấu ngoặc kép; nó render chữ đáng tin cậy hơn phần còn lại.
- Seedream 5.0 — tập trung vào chi tiết photoreal (da, ánh mắt, chiều sâu); nó lý luận tốt về chủ nghĩa hiện thực và cũng xử lý văn bản trong ảnh.
- Midjourney V8 — cung cấp cho nó các từ về cảm xúc và phong cách; nó nghiêng về cinematic và painterly theo mặc định.
- Nano Banana Pro — để chỉnh sửa chính xác, mô tả chỉ sự thay đổi (“make the jacket red”); nó chỉnh sửa cục bộ mà không cần mặt nạ, và cũng mạnh về văn bản trong ảnh.
a neon sign reading "OPEN 24 HOURS". Xem GPT Image 2 text rendering.Chưa biết nên dùng cái nào? Chọn mô hình phân tích tất cả các mô hình.
--ar, --v, hoặc --style vào prompt — PonPon phân tích chúng như các từ thông thường và mô hình sẽ từ chối toàn bộ quá trình tạo. Thay vào đó hãy dùng các điều khiển tỷ lệ khung hình, phiên bản và phong cách trong thanh prompt.Khắc phục các sự cố thường gặp
| Sự cố | Thử cách này |
|---|---|
| Văn bản trong ảnh bị hỏng | Chuyển sang GPT Image 2; đặt các từ chính xác trong dấu ngoặc kép |
| Nhấn mạnh chủ thể sai | Đặt chủ thể lên trước; loại bỏ các chi tiết nền thừa khỏi prompt |
| Nhân vật không nhất quán giữa các ảnh | Dùng ảnh tham chiếu và mô hình mạnh về nhất quán như Nano Banana Pro |
| Gần đúng rồi, chỉ sai một chi tiết | Đừng tạo lại — chỉnh sửa kết quả hoặc chú thích và chỉnh sửa chỉ vùng đó |
| Phong cách cứ bị thay đổi | Đặt tên chất liệu rõ ràng và cung cấp ảnh tham chiếu |
Lặp lại có chủ đích
Thay đổi một biến số mỗi lần — mô hình, rồi ánh sáng, rồi bố cục — để bạn học được tác động của từng thay đổi. Khi một lô ảnh đã gần đúng, hãy chuyển sang chỉnh sửa thay vì viết lại toàn bộ prompt: sửa một từ bằng text edit, thay đổi góc máy bằng multi-angle, hoặc tinh chỉnh nền thay vì bắt đầu lại.
Sẵn sàng chuyển những kỹ năng này sang chuyển động? Đọc Viết prompt cho video.
Bài viết liên quan
- Cơ bản tạo ảnh AIViết prompt ảnh hiệu quả, lựa chọn mô hình phù hợp như GPT Image 2, Nano Banana Pro và Seedream 5.0, sử dụng ảnh tham chiếu, và chỉnh sửa kết quả bằng các công cụ chú thích.
- Viết prompt cho videoPhương pháp thực tiễn để viết prompt video AI trên PonPon: cấu trúc cảnh quay, các lệnh camera mà mô hình hiểu được, nhịp độ, mẹo theo từng mô hình, và cách khắc phục lỗi thường gặp.
- Chọn model AICách chọn model AI phù hợp trên PonPon: điểm mạnh của từng model ảnh và video, bảng so sánh nhanh, ví dụ thực tế, so sánh trực tiếp và các gói Fast vs Pro.