Menulis Prompt untuk Gambar
Metode praktis untuk membuat prompt gambar AI di PonPon: struktur yang andal, penulisan ulang dari lemah ke kuat, kosakata gaya dan pencahayaan yang dipahami model, referensi gambar, serta solusi masalah umum.
Prompt gambar yang baik dibaca seperti arahan yang kamu berikan kepada fotografer atau ilustrator: apa yang ada dalam frame, gayanya, komposisinya, dan pencahayaannya. Cakup keempat hal itu, dan kamu akan mendapatkan gambar yang berguna jauh lebih sering dibanding hanya mengetik satu kata.

Struktur yang andal
Tulis dengan urutan ini — sesuai dengan cara shot sebenarnya direncanakan:
- Subjek — apa yang ada dalam frame, spesifik. “Cangkir kopi keramik di atas serbet linen.”
- Gaya — medium dan pendekatannya. “Foto produk editorial,” “illustrasi vektor flat,” “3D render,” “cat air.”
- Komposisi — framing dan sudut pandang. “Close-up, top-down, terpusat, depth of field dangkal.”
- Cahaya & suasana — “Cahaya pagi yang lembut,” “malam neon,” “studio softbox, high-key.”
Foto produk editorial dari kotak earbud nirkabel matte hitam di atas permukaan batu basah, top-down, depth of field dangkal, cahaya studio difus yang lembut, minimalis, nada warna dingin.
Dari lemah ke kuat
Ide yang sama, dipertajam dengan menambahkan kekhususan subjek, lalu gaya, lalu cahaya:
| Prompt | Hasil |
|---|---|
| “a coffee cup” | Cangkir generik, gaya dan pencahayaan acak |
| “a ceramic coffee cup on a linen napkin” | Subjek benar, tapi datar dan tanpa gaya |
| “editorial photo of a ceramic coffee cup on a linen napkin, close-up” | Komposisi sesuai brief |
| “editorial photo of a ceramic coffee cup on a linen napkin, close-up, soft morning window light, shallow depth of field” | Shot yang sebenarnya kamu inginkan |
Setiap klausa yang ditambahkan menghilangkan satu keputusan yang seharusnya dibuat model untukmu.
Kosakata yang dipahami model
Gunakan istilah yang konkret daripada kata sifat yang samar — model memetakan istilah-istilah ini ke pola visual nyata:
- Medium — foto, ilustrasi, 3D render, lukisan minyak, line art, isometrik, claymation.
- Shot & lensa — close-up, wide shot, macro, top-down, eye-level, 35mm, bokeh, fisheye.
- Cahaya — golden hour, backlit, rim light, softbox, hard shadow, high-key, low-key.
- Suasana / palet — muted pastels, high-contrast, monokrom, warm tones, sinematik.
Sebutkan yang kamu inginkan, bukan yang tidak kamu inginkan
Model jauh lebih baik menangani deskripsi positif daripada negasi. Minta “meja kosong yang minimalis,” bukan “meja tanpa apa-apa di atasnya.” Jika kamu akan menambahkan teks atau logo di atasnya nanti, prompt untuk negative space — “langit kosong yang luas di bagian atas” — daripada mendeskripsikan apa yang seharusnya tidak ada di sana.
Bekerja dengan gambar referensi
Lampirkan hingga 10 gambar referensi untuk memandu gaya, komposisi, atau subjek tertentu. Saat menulis prompt, ketik @ untuk menunjuk gambar lampiran tertentu:
Taruh @Image1 di atas meja dalam @Image2, samakan pencahayaannya dengan @Image2.
Ini cara paling bersih untuk menggabungkan beberapa referensi menjadi satu shot — lihat Anotasi edit & gambar referensi untuk alur kerja referensi dan pengeditan lengkap.
Sesuaikan prompt dengan model
Prompt yang sama bisa digunakan lintas model, tetapi masing-masing model mendapat hasil terbaik dengan penekanan yang sedikit berbeda:
- GPT Image 2 — tuliskan setiap teks dalam gambar secara eksplisit, dalam tanda kutip; model ini merender kata-kata lebih andal dibanding yang lain.
- Seedream 5.0 — manfaatkan detail fotoreal (kulit, tatapan, kedalaman); model ini memahami realisme dengan baik dan juga menangani teks dalam gambar.
- Midjourney V8 — beri kata-kata suasana dan gaya; model ini secara default condong ke arah sinematik dan painterly.
- Nano Banana Pro — untuk pengeditan presisi, deskripsikan hanya perubahannya (“make the jacket red”); model ini mengedit secara lokal tanpa mask, dan juga kuat dalam teks dalam gambar.
a neon sign reading “OPEN 24 HOURS”. Lihat GPT Image 2 text rendering.Tidak yakin model mana yang digunakan? Memilih model menjelaskan semuanya secara rinci.
--ar, --v, atau --style ke dalam prompt — PonPon memparsanya sebagai kata biasa dan model menolak seluruh proses generasi. Gunakan kontrol rasio aspek, versi, dan gaya di bilah prompt.Memperbaiki masalah umum
| Masalah | Coba ini |
|---|---|
| Teks di gambar tidak terbaca | Beralih ke GPT Image 2; taruh kata-kata eksak dalam tanda kutip |
| Penekanan subjek salah | Taruh subjek di bagian pertama; hapus elemen latar belakang yang tidak perlu dari prompt |
| Karakter tidak konsisten antar gambar | Gunakan gambar referensi dan model yang kuat dalam konsistensi seperti Nano Banana Pro |
| Hampir benar, satu detail tidak pas | Jangan re-roll — edit hasilnya atau anotasi dan edit hanya area itu |
| Gaya terus berubah | Sebutkan medium secara eksplisit dan sertakan gambar referensi |
Iterasi dengan sengaja
Ubah satu variabel sekaligus — model, lalu cahaya, lalu komposisi — agar kamu memahami apa yang dilakukan setiap perubahan. Ketika sebuah batch sudah mendekati yang diinginkan, beralih ke pengeditan daripada menulis ulang seluruh prompt: perbaiki kata dengan text edit, ubah kamera dengan multi-angle, atau perbaiki latar belakang alih-alih memulai dari awal.
Siap membawa intuisi ini ke dalam gerak? Baca Menulis Prompt untuk Video.
Artikel terkait
- Dasar pembuatan gambarTulis prompt gambar yang baik, pilih model seperti GPT Image 2, Nano Banana Pro, dan Seedream 5.0, gunakan gambar referensi, dan edit hasil dengan alat anotasi.
- Prompt untuk videoMetode praktis untuk membuat prompt video AI di PonPon: struktur shot, preset kamera yang dipahami model, pacing, tips per model, dan cara memperbaiki masalah umum.
- Memilih ModelCara memilih model AI yang tepat di PonPon: keunggulan masing-masing model gambar dan video, tabel keputusan cepat, perbandingan langsung, adu model head-to-head, serta tier Fast vs Pro.