Gemini 推理进行布局规划
在生成图像之前,Nano Banana Pro 使用 Gemini 3 Pro 的推理模式规划文字应该出现的位置、每个字符相对于画布的大小,以及文字如何换行或弯曲以适应目标表面。这个预规划步骤防止了常见的文字错误,如字符重叠或文字超出边缘。
图像中的文字渲染是指图像生成模型在生成的图像中产生可辨识、拼写正确文字的能力——在标志、标签、海报、屏幕、服装或任何表面上。这在历史上一直是图像生成中最困难的问题之一:早期模型产生乱码字母、拼写错误或类似文字但不可读的字符。现代方法使用语言模型推理在图像生成步骤之前规划文字布局、字体大小和字符形状,将文字视为结构化约束而非视觉纹理。
在生成图像之前,Nano Banana Pro 使用 Gemini 3 Pro 的推理模式规划文字应该出现的位置、每个字符相对于画布的大小,以及文字如何换行或弯曲以适应目标表面。这个预规划步骤防止了常见的文字错误,如字符重叠或文字超出边缘。
不仅渲染单个词,还渲染完整句子和短段落。菜单板、海报文案和产品说明等多行正确格式化的文字——适当的换行、一致的间距和对齐的边距。
生成英文、中文、日文、韩文和拉丁字母欧洲语言的文字。模型处理不同文字系统的字符复杂性——中日韩字符、带重音的拉丁字母和同一图像中的混合语言文字。
Nano Banana Pro 可以将文字内容与 Google 搜索结果对接——适用于生成包含真实品牌名称、准确产品规格或事实引用的图像。模型从网络数据中检索正确的拼写和格式。
文字在不同表面上适当渲染:在标志上平展、在马克杯上弯曲、在皮革上浮雕、在织物上印刷、在屏幕上显示。模型匹配透视扭曲、材质纹理和光照,使文字看起来是物理存在而非叠加。
前往 PonPon Image,从模型下拉菜单中选择 Nano Banana Pro。
在提示词中用引号括起你想渲染的文字:*「一块咖啡店黑板菜单,上面写着 'Espresso $4 · Latte $5 · Cappuccino $5',白色粉笔字体。」* 模型将逐字渲染引号中的文字。
描述文字应出现的位置及其视觉处理方式:*"店面橱窗上粗体白色无衬线文字"* 或 *"明信片底部的手写脚本体"*。明确指定字体样式、颜色和位置。
点击 生成 并放大渲染的文字。检查拼写、字符完整性和在预期查看大小下的可读性。如果有字符变形,重新生成。
如果文字大部分正确但有一个词出错,使用 Nano Banana Pro 的精准编辑仅修复文字而无需重新生成整个图像。
无论你是独立创作者、设计团队还是品牌方,每个模型都能适应你的工作方式。
A rustic chalkboard mounted on a brick wall. Written in white chalk: 'DAILY SPECIALS' at the top in large letters, followed by 'Drip Coffee $3.50' and 'Cold Brew $4.50' and 'Matcha Latte $5.00'. Small chalk drawing of a coffee cup in the corner. Warm café lighting.
模型:Nano Banana Pro · 推理:思考模式 · 分辨率:1024×1024
A minimalist book cover with a dark navy background. The title 'THE QUIET HOURS' in large gold serif letters centered on the cover. Below in smaller white text: 'A Novel by Sarah Chen'. Subtle embossed texture on the background. Clean, editorial design.
模型:Nano Banana Pro · 推理:思考模式 · 分辨率:768×1024
A cylindrical tea canister with a matte green finish. The label reads 'SENCHA' in large English letters at the top, '煎茶' in Japanese characters below, and 'Premium Green Tea · 100g' at the bottom. Minimalist Japanese design aesthetic. White background studio shot.
模型:Nano Banana Pro · 推理:思考模式 · 分辨率:1024×1024
A glass storefront window with gold vinyl lettering that reads 'BAKER & BLOOM' in an elegant sans-serif font. Below in smaller text: 'Artisan Bakery · Est. 2019'. Blurred interior visible through the glass. Morning sunlight reflects on the window. Street-level perspective.
模型:Nano Banana Pro · 推理:思考模式 · 分辨率:1024×768
生成带有样式化文字的可分享金句图——励志名言、书籍摘录或品牌标语渲染在设计好的背景上。无需 Canva 模板——在一个提示词中描述美学和文字即可。
生成带有可读品牌名称、成分列表和尺寸标签的产品包装。适用于在投资实体包装设计之前的提案演示和概念验证。
创建餐厅菜单板、店铺标识和路标概念,带有正确的文字。比样稿工具更快,适合早期设计探索——在 Figma 中构建 1 个菜单板的时间内,生成 10 个菜单板概念。
生成同一营销图像的不同语言文字版本——英文、日文和西班牙文的广告横幅。模型原生处理每种语言的排版要求。
| Nano Banana Pro | GPT Image 2 | |
|---|---|---|
| 文字准确度 | 高准确度——Gemini 推理在生成前预先规划字符布局 | 报告约 99% 准确率——在长字符串和边缘案例上略微更高的一致性 |
| 多语言支持 | 英语、中文、日文、韩文和欧洲语言,具有正确的字形渲染 | 英语和欧洲语言很强。中日韩文字支持可用,但测试较少 |
| 世界知识接地 | Google 搜索接地——检索品牌、地点、专业术语的正确拼写 | 基于训练数据的强大通用知识,但无实时搜索接地 |
| 多轮文字编辑 | 单轮生成 + 通过精准编辑模式单独编辑 | 内置多轮编辑——在同一对话中迭代精修文字 |
| 最适合 | 多语言文字、需要搜索接地的事实内容、表面感知放置 | 长英文文字、迭代精修、含多处修正的文字密集构图 |
始终引用你想渲染的文字:'Your Text Here'。不使用引号,模型可能会将文字解释为提示词指令而非要渲染的内容。生成前仔细检查拼写——模型渲染你输入的内容。
如果你有偏好,不要让模型自行选择字体。描述它:"粗体无衬线"、"细衬线"、"手写脚本体"、"等宽"。没有指导时,模型选择适合场景的样式——但可能不符合你的品牌准则。
短文字(1-15 个词)渲染最可靠。随着文字长度超过约 30 个词,出现拼写错误或变形字符的概率增加。对于段落级别的文字,分段生成或将图像作为设计稿而非最终素材使用。
如果你的提示词包含小文字(如细则、成分列表),以最高可用分辨率生成。在 512×512 下,约 20px 以下的文字无论模型准确率如何都会模糊。文字密集的图像使用 1024×1024 或更大。
加入数千名每天使用 PonPon 的创作者、设计团队和品牌方。