Generasi teks-dalam-gambar mengacu pada kemampuan model AI untuk merender teks yang terbaca dan ejaannya benar di dalam gambar yang dihasilkan. Berbeda dengan menambahkan teks di editor grafis (yang berada di atas gambar), teks yang dirender AI merupakan bagian dari adegan yang dihasilkan — muncul di permukaan seperti tanda, layar, pakaian, dan kemasan dengan perspektif, pencahayaan, dan interaksi material yang tepat. Kualitas teks-dalam-gambar sangat bervariasi antar model: beberapa menghasilkan hasil yang konsisten terbaca untuk teks pendek, sementara yang lain kesulitan dengan akurasi karakter di luar satu kata.