レイアウト計画のためのGemini推論
画像を生成する前に、Nano Banana ProはGemini 3 Proの推論モードを使ってテキストが表示される場所・各文字がキャンバスに対してどの程度の大きさにすべきか・テキストがターゲット表面に収まるようにどう折り返すかを計画します。この事前計画ステップにより、文字の重なりやテキストが端からはみ出すなどの一般的なテキストエラーが防止されます。
テキスト・イン・イメージレンダリングとは、生成された画像内で判読可能かつ正しくスペルされたテキストを生成するAI画像生成モデルの能力です——サイン・ラベル・ポスター・スクリーン・衣服・あらゆる表面上に。これは歴史的に画像生成において最も難しい問題の1つでした:初期のモデルはぐちゃぐちゃな文字・スペルミス・テキストに似ているが読めない文字を生成していました。現代のアプローチは、言語モデルの推論を使ってテキストレイアウト・フォントサイジング・文字形状を画像生成ステップの前に計画し、テキストを視覚的なテクスチャではなく構造化された制約として扱います。
画像を生成する前に、Nano Banana ProはGemini 3 Proの推論モードを使ってテキストが表示される場所・各文字がキャンバスに対してどの程度の大きさにすべきか・テキストがターゲット表面に収まるようにどう折り返すかを計画します。この事前計画ステップにより、文字の重なりやテキストが端からはみ出すなどの一般的なテキストエラーが防止されます。
単語だけでなく、完全な文章や短い段落もレンダリングします。正しくフォーマットされた複数行のテキスト——適切な改行・一貫したスペーシング・揃ったマージン——を持つメニューボード・ポスターのコピー・商品説明。
英語・中国語・日本語・韓国語・ラテンアルファベットのヨーロッパ言語でテキストを生成します。モデルは各スクリプトの文字の複雑さを処理します——CJK文字・アクセント付きラテン文字・同じ画像内の混合言語テキスト。
Nano Banana ProはGoogleサーチの結果に対してテキストコンテンツをグラウンドできます——実際のブランド名・正確な商品仕様・事実に基づいた引用文を含む画像生成に役立ちます。モデルはウェブデータから正しいスペルとフォーマットを取得します。
テキストは異なる表面に適切にレンダリングされます:サインに平面的に・マグカップに曲がって・革にエンボスされて・布にプリントされて・スクリーンに表示されて。モデルはパースの歪み・素材のテクスチャ・照明を一致させて、テキストが重ねられているのではなく物理的にそこに存在するように見せます。
PonPon Imageにアクセスし、モデルドロップダウンからNano Banana Proを選択します。
レンダリングしたいテキストをプロンプト内で引用符に入れてください:*「『エスプレッソ $4・ラテ $5・カプチーノ $5』と白いチョーク文字で書かれたコーヒーショップの黒板メニュー。」* モデルは引用符内のテキストをそのままレンダリングします。
テキストが表示される場所とそのビジュアル処理を説明します:*「店のショーウィンドウに太いサンセリフの白いテキスト」*や*「ポストカードの下部に手書きのスクリプト体。」* フォントスタイル・色・位置を明示してください。
生成をクリックし、レンダリングされたテキストにズームインします。スペル・文字の完全性・意図した表示サイズでの読みやすさを確認してください。文字が崩れている場合は再生成してください。
テキストがほぼ正しいが1単語が間違っている場合は、Nano Banana Proの精密編集を使って画像全体を再生成せずにそのテキストだけを修正してください。
個人クリエイター、エージェンシー、ブランドを問わず、すべてのモデルがあなたのワークフローに適応します。
A rustic chalkboard mounted on a brick wall. Written in white chalk: 'DAILY SPECIALS' at the top in large letters, followed by 'Drip Coffee $3.50' and 'Cold Brew $4.50' and 'Matcha Latte $5.00'. Small chalk drawing of a coffee cup in the corner. Warm café lighting.
モデル: Nano Banana Pro · 推論: Thinking · 解像度: 1024×1024
A minimalist book cover with a dark navy background. The title 'THE QUIET HOURS' in large gold serif letters centered on the cover. Below in smaller white text: 'A Novel by Sarah Chen'. Subtle embossed texture on the background. Clean, editorial design.
モデル: Nano Banana Pro · 推論: Thinking · 解像度: 768×1024
A cylindrical tea canister with a matte green finish. The label reads 'SENCHA' in large English letters at the top, '煎茶' in Japanese characters below, and 'Premium Green Tea · 100g' at the bottom. Minimalist Japanese design aesthetic. White background studio shot.
モデル: Nano Banana Pro · 推論: Thinking · 解像度: 1024×1024
A glass storefront window with gold vinyl lettering that reads 'BAKER & BLOOM' in an elegant sans-serif font. Below in smaller text: 'Artisan Bakery · Est. 2019'. Blurred interior visible through the glass. Morning sunlight reflects on the window. Street-level perspective.
モデル: Nano Banana Pro · 推論: Thinking · 解像度: 1024×768
スタイリングされたテキスト入りの共有可能な引用画像を生成します——デザインされた背景の上にレンダリングされたモチベーション名言・本の抜粋・ブランドタグライン。Canvaのテンプレートは不要——1つのプロンプトで美学とテキストを記述するだけです。
読めるブランド名・成分リスト・サイズラベルが付いた商品パッケージを生成します。物理的なパッケージデザインに投資する前のピッチデッキとコンセプト検証に役立ちます。
正しいテキストが入ったレストランのメニューボード・店舗サイン・ウェイファインディングのコンセプトを作成します。初期段階のデザイン探索においてモックアップツールより速い——Figmaで1つ作る時間で10のメニューボードコンセプトを生成できます。
同じマーケティング画像を異なる言語のテキストで生成します——英語・日本語・スペイン語の広告バナー。モデルは各言語のタイポグラフィ要件をネイティブに処理します。
| Nano Banana Pro | GPT Image 2 | |
|---|---|---|
| テキスト精度 | 高精度——Geminiの推論が生成前に文字レイアウトを事前計画 | 約99%の精度が報告されている——長い文字列やエッジケースでの一貫性がやや高い |
| 多言語サポート | 英語・中国語・日本語・韓国語・ヨーロッパ系言語で正しいグリフレンダリング | 英語・ヨーロッパ系言語は強い。CJKサポートは利用可能だが検証が少ない |
| ワールド知識のグラウンディング | Googleサーチグラウンディング——ブランド・地名・専門用語の正しいスペルを検索 | トレーニングデータからの強力な一般知識があるがライブ検索グラウンディングはなし |
| マルチターンテキスト編集 | シングルターン生成+精密編集モードによる別途編集 | 組み込みのマルチターン編集——同じ会話内でテキストを繰り返し洗練できる |
| 最適なユースケース | 多言語テキスト、サーチグラウンディングが必要なファクチュアルコンテンツ、表面を意識した配置 | 長い英語テキスト、反復的な修正、多くの修正が必要なテキスト重視のコンポジション |
レンダリングしたいテキストを常に引用符で囲んでください:「ここにあなたのテキスト」。引用符がないと、モデルはテキストをレンダリングするコンテンツではなくプロンプトの指示として解釈する場合があります。生成前にスペルをダブルチェックしてください——モデルはあなたが入力したとおりにレンダリングします。
好みがある場合はフォントの選択をモデルに任せないでください。説明してください:「太いサンセリフ」「細いセリフ」「手書きのスクリプト」「モノスペース」。ガイダンスがないと、モデルはシーンに合ったスタイルを選びますが、それがブランドガイドラインと一致しない場合があります。
短いテキスト(1〜15語)が最も確実にレンダリングされます。テキスト長が30語を超えると、スペルミスや崩れた文字が生じる可能性が高くなります。段落の長さのテキストには、セクションに分けて生成するか、画像をファイナルアセットではなくデザインカンプとして使用してください。
プロンプトに小さいテキスト(細字・成分リストなど)が含まれている場合は、利用可能な最高解像度で生成してください。512×512では、モデルの精度に関わらず20px相当以下のテキストはぼやけます。テキストが多い画像には1024×1024以上を使用してください。
毎日PonPonを使っている何千ものクリエイター、エージェンシー、ブランドの仲間入りをしましょう。