自然语言物体定位
用自然语言描述要编辑的物体:"左边桌子上的咖啡杯"或"围栏后面的红色汽车"。Nano Banana Pro 使用 Gemini 3 Pro 的语言理解来定位精确的物体——无需坐标输入、边界框或蒙版。
精准物体编辑让你使用自然语言指令修改图像中的特定元素——「把红色汽车换成蓝色卡车」或「移除背景中的人」——无需手动绘制选择蒙版或图层边界。模型在内部识别目标区域,推理编辑在给定周围环境(光照、透视、阴影)下应该如何呈现,并无缝合成更改。这与基于蒙版的编辑(Photoshop 生成填充,需要先勾勒目标区域)和全图重新生成(整张图像被重新生成)形成对比。
用自然语言描述要编辑的物体:"左边桌子上的咖啡杯"或"围栏后面的红色汽车"。Nano Banana Pro 使用 Gemini 3 Pro 的语言理解来定位精确的物体——无需坐标输入、边界框或蒙版。
模型在编辑前使用思维链推理步骤:识别目标物体、分析周围环境(光照角度、透视、阴影方向),并规划编辑以匹配。这个推理步骤减少了阴影不匹配或透视破坏等物理上不可能的编辑。
三种编辑类型:用其他东西替换物体("把台灯换成蜡烛")、完全移除物体("移除水印"),或修改属性("把汽车从红色改成蓝色")。每种操作都逐像素保留未触及的部分。
编辑包含人物的图像时,Nano Banana Pro 对场景中最多 5 个角色和 14 个不同物体保持身份一致性。编辑一个角色的服装不会影响其他人的外观。
编辑尊重图像现有的光照、透视和材质属性。将木桌替换为玻璃桌,反射、阴影和周围物体都会更新以匹配新材质的物理特性。
前往 PonPon Image,从模型下拉菜单中选择 Nano Banana Pro。切换到编辑模式。
上传你想修改的图像。支持格式:PNG、JPG、WebP。更高分辨率的图像为精确编辑提供更多上下文。
用自然语言描述编辑。具体说明目标和期望的更改:*"将椅子上的红色背包替换为棕色皮质信使包。保持其他一切不变。"*
点击 生成 并将结果与原始图像对比。放大编辑区域检查边缘混合、阴影一致性和透视准确性。
如有需要,对结果进行额外编辑——更改另一个物体、调整颜色或精修第一次编辑。每次编辑在前一次的输出基础上构建。
无论你是独立创作者、设计团队还是品牌方,每个模型都能适应你的工作方式。
Replace the white sneakers with the same model in matte black. Keep the laces white. Maintain the same lighting, angle, and surface texture. Everything else in the image stays identical.
模型:Nano Banana Pro · 模式:编辑 · 推理:思考模式
Remove the water bottle from the desk. Fill the area with the same wooden desk surface, matching the grain direction and lighting. Do not change anything else in the image.
模型:Nano Banana Pro · 模式:编辑 · 推理:思考模式
Replace the potted succulent on the windowsill with a small bonsai tree. Match the pot style to a dark ceramic. The bonsai should cast a shadow consistent with the window light direction.
模型:Nano Banana Pro · 模式:编辑 · 推理:思考模式
Change the woman's hair color from blonde to dark auburn. Keep the hairstyle, length, and texture exactly the same. Do not change her face, clothing, or any other part of the image.
模型:Nano Banana Pro · 模式:编辑 · 推理:思考模式
从单次拍摄生成产品颜色变体。"把沙发面料从灰色改成海军蓝"或"把木腿换成镀铬"。无需重新拍摄、无需 3D 渲染——只需描述变体。
修改已布置的照片而无需重新布置:更换家具、改变墙面油漆颜色或移除个人物品。每次编辑保留房间的光照和透视,使结果看起来像实拍而非合成。
为不同市场调整营销图像:"将英文招牌替换为日文文字"或"替换当地货币符号"。编辑特定的文字和标识,无需重新生成整个场景。
设计师可以快速探索变体:在室内尝试不同的家具、在产品上测试配色方案,或在时装拍摄中试验不同的服装选项——全部来自单张源图像。
| Nano Banana Pro(自然语言编辑) | 其他编辑工具 | |
|---|---|---|
| 目标选择 | 自然语言——描述要编辑的物体,无需蒙版 | GPT Image 2:同样基于自然语言。Photoshop 生成填充:需要手动绘制蒙版 |
| 编辑前推理 | Gemini 3 Pro「思考」模式——链式推理规划上下文感知编辑 | GPT Image 2:隐式推理。Photoshop:无推理——独立填充蒙版区域 |
| 角色一致性 | 维持最多 5 个角色和 14 个物体——编辑其中一个不影响其他 | GPT Image 2:强大的多轮编辑。Photoshop:无角色感知 |
| 替换的世界知识 | Google 搜索接地——知道特定产品、品牌和物体的外观 | GPT Image 2:基于训练数据的强大通用知识。Photoshop:受限于训练数据 |
| 最适合 | 具有物理准确度(阴影、反射、透视)的精准单物体编辑 | GPT Image 2:多轮迭代编辑会话。Photoshop:像素级精准手动控制 |
"那个杯子"在有多个杯子时是模糊的。使用区分细节:"桌子左边的蓝色马克杯"或"穿红色夹克的人"。模糊的目标可能导致模型编辑错误的物体。
明确保护重要元素:"不要改变背景"或"保持人物的面部和发型不变"。没有约束条件,模型可能会做出比预期更广泛的更改,特别是在复杂场景中。
如果你需要更改 3 个以上的物体,一次编辑一个。每次编辑在前一次的结果上构建,给你一个检查点在继续之前验证。在一条指令中批量处理太多更改会降低精度。
如果一个物体完全被遮挡(隐藏在其他东西后面),模型没有该物体在此角度下外观的上下文。编辑在可见物体上效果最好,模型可以从现有像素分析形状、光照和上下文。
加入数千名每天使用 PonPon 的创作者、设计团队和品牌方。