Gemini 推理進行排版規劃
在生成圖像之前,Nano Banana Pro 使用 Gemini 3 Pro 的推理模式規劃文字應該出現的位置、每個字元相對於畫布的大小,以及文字如何換行或彎曲以適應目標表面。這個預規劃步驟防止了常見的文字錯誤,如字元重疊或文字超出邊緣。
圖像中的文字算繪是指圖像生成模型在生成的圖像中產出可辨識、拼寫正確文字的能力——在標誌、標籤、海報、螢幕、服裝或任何表面上。這在歷史上一直是圖像生成中最困難的問題之一:早期模型產出亂碼字母、拼寫錯誤或類似文字但不可讀的字元。現代方法使用語言模型推理在圖像生成步驟之前規劃文字排版、字體大小和字元形狀,將文字視為結構化限制條件而非視覺紋理。
在生成圖像之前,Nano Banana Pro 使用 Gemini 3 Pro 的推理模式規劃文字應該出現的位置、每個字元相對於畫布的大小,以及文字如何換行或彎曲以適應目標表面。這個預規劃步驟防止了常見的文字錯誤,如字元重疊或文字超出邊緣。
不僅算繪單個詞,還算繪完整句子和短段落。選單板、海報文案和產品說明等多行正確格式化的文字——適當的換行、一致的間距和對齊的邊距。
生成英文、中文、日文、韓文和拉丁字母歐洲語言的文字。模型處理不同文字系統的字元複雜性——中日韓字元、帶重音的拉丁字母和同一圖像中的混合語言文字。
Nano Banana Pro 可以將文字內容與 Google 搜尋結果對接——適用於生成包含真實品牌名稱、準確產品規格或事實引用的圖像。模型從網路數據中檢索正確的拼寫和格式。
文字在不同表面上適當算繪:在標誌上平展、在馬克杯上彎曲、在皮革上浮雕、在織物上印刷、在螢幕上顯示。模型匹配透視扭曲、材質紋理和光照,使文字看起來是物理存在而非疊加。
前往 PonPon Image,從模型下拉選單中選擇 Nano Banana Pro。
在提示詞中用引號括起你想算繪的文字:*「一塊咖啡店黑板選單,上面寫著 'Espresso $4 · Latte $5 · Cappuccino $5',白色粉筆字體。」* 模型將逐字算繪引號中的文字。
描述文字應出現的位置及其視覺處理方式:*「店面櫥窗上粗體白色無襯線文字」* 或 *「明信片底部的手寫腳本體」*。明確指定字體樣式、顏色和位置。
點擊 生成 並放大算繪的文字。檢查拼寫、字元完整性和在預期查看大小下的可讀性。如果有字元變形,重新生成。
如果文字大部分正確但有一個詞出錯,使用 Nano Banana Pro 的精準編輯僅修復文字而無需重新生成整個圖像。
無論你是獨立創作者、設計團隊還是品牌方,每個模型都能適應你的工作方式。
A rustic chalkboard mounted on a brick wall. Written in white chalk: 'DAILY SPECIALS' at the top in large letters, followed by 'Drip Coffee $3.50' and 'Cold Brew $4.50' and 'Matcha Latte $5.00'. Small chalk drawing of a coffee cup in the corner. Warm café lighting.
模型:Nano Banana Pro · 推理:思考模式 · 解析度:1024×1024
A minimalist book cover with a dark navy background. The title 'THE QUIET HOURS' in large gold serif letters centered on the cover. Below in smaller white text: 'A Novel by Sarah Chen'. Subtle embossed texture on the background. Clean, editorial design.
模型:Nano Banana Pro · 推理:思考模式 · 解析度:768×1024
A cylindrical tea canister with a matte green finish. The label reads 'SENCHA' in large English letters at the top, '煎茶' in Japanese characters below, and 'Premium Green Tea · 100g' at the bottom. Minimalist Japanese design aesthetic. White background studio shot.
模型:Nano Banana Pro · 推理:思考模式 · 解析度:1024×1024
A glass storefront window with gold vinyl lettering that reads 'BAKER & BLOOM' in an elegant sans-serif font. Below in smaller text: 'Artisan Bakery · Est. 2019'. Blurred interior visible through the glass. Morning sunlight reflects on the window. Street-level perspective.
模型:Nano Banana Pro · 推理:思考模式 · 解析度:1024×768
生成帶有樣式化文字的可分享金句圖——勵志名言、書籍摘錄或品牌標語算繪在設計好的背景上。無需 Canva 範本——在一個提示詞中描述美學和文字即可。
生成帶有可讀品牌名稱、成分列表和尺寸標籤的產品包裝。適用於在投資實體包裝設計之前的提案簡報和概念驗證。
建立餐廳選單板、店鋪標識和路標概念,帶有正確的文字。比樣稿工具更快,適合早期設計探索——在 Figma 中建構 1 個選單板的時間內,生成 10 個選單板概念。
生成同一行銷圖像的不同語言文字版本——英文、日文和西班牙文的廣告橫幅。模型原生處理每種語言的排版要求。
| Nano Banana Pro | GPT Image 2 | |
|---|---|---|
| 文字準確度 | 高準確度——Gemini 推理在生成前預先規劃字元排版 | 報告約 99% 準確率——在長字串和邊緣案例上略微更高的一致性 |
| 多語言支援 | 英語、中文、日文、韓文和歐洲語言,具有正確的字形算繪 | 英語和歐洲語言很強。中日韓文字支援可用,但測試較少 |
| 世界知識接地 | Google 搜尋接地——檢索品牌、地點、專業術語的正確拼寫 | 基於訓練資料的強大通用知識,但無即時搜尋接地 |
| 多輪文字編輯 | 單輪生成 + 透過精準編輯模式單獨編輯 | 內建多輪編輯——在同一對話中迭代精修文字 |
| 最適合 | 多語言文字、需要搜尋接地的事實內容、表面感知放置 | 長英文文字、迭代精修、含多處修正的文字密集構圖 |
始終引用你想算繪的文字:'Your Text Here'。不使用引號,模型可能會將文字詮釋為提示詞指令而非要算繪的內容。生成前仔細檢查拼寫——模型算繪你輸入的內容。
如果你有偏好,不要讓模型自行選擇字體。描述它:「粗體無襯線」、「細襯線」、「手寫腳本體」、「等寬」。沒有指導時,模型選擇適合場景的樣式——但可能不符合你的品牌準則。
短文字(1-15 個詞)算繪最可靠。隨著文字長度超過約 30 個詞,出現拼寫錯誤或變形字元的機率增加。對於段落級別的文字,分段生成或將圖像作為設計稿而非最終素材使用。
如果你的提示詞包含小文字(如細則、成分列表),以最高可用解析度生成。在 512×512 下,約 20px 以下的文字無論模型準確率如何都會模糊。文字密集的圖像使用 1024×1024 或更大。
加入數千名每天使用 PonPon 的創作者、設計團隊和品牌方。