Görüntüde metin oluşturma, bir yapay zeka modelinin oluşturulan görseller içinde okunaklı ve doğru yazılmış metinleri render etme yeteneğini ifade eder. Bir grafik editöründe metnin üstüne eklenmesinin aksine (ki bu görüntünün üzerinde durur), yapay zeka ile render edilen metin oluşturulan sahnenin bir parçasıdır — tabelalar, ekranlar, kıyafetler ve ambalaj gibi yüzeylerde doğru perspektif, aydınlatma ve malzeme etkileşimiyle görünür. Görsellerde metin kalitesi modeller arasında önemli ölçüde farklılık gösterir: bazıları kısa metinler için tutarlı biçimde okunabilir sonuçlar üretirken, diğerleri tek kelimenin ötesinde karakter doğruluğuyla mücadele eder.