谷歌发布最强生图模型Nano Banana 2

谷歌发布的生图模型Nano Banana 2,无疑是一次视觉技术的革命性突破。现在,用户可以直接在Gemini中调用该模型,轻松生成生动逼真的图像。切换到Fast模式,即可立即体验这一前沿技术带来的震撼。

该模型的底层技术基于Gemini 3.1 Flash构建,技术代号Gemini 3.1 Flash Image,展现了从“像素模仿”到“逻辑理解”的飞跃。它仿佛被赋予了物理常识和思维逻辑,宛如一位“视觉导演”,为我们创造出超越现实的艺术品。

Nano Banana 2的核心突破包括四大能力,首先是具备“推理能力”的视觉引擎。这一点像是给模型赋予了思考的能力,使其在生成像素之前先分析场景逻辑。处理物体遮挡关系、光的折射、重力感等物理场景,能够大大减少AI常见的“灵异”错误。

其二,该模型能够完美渲染文字与图表。无论是清晰的招牌、海报,还是多行文本,都能生成毫无错别字。它支持直接生成结构正确的信息图表、UI界面原型图,甚至带有数学符号的教学图解,这对于设计领域来说无疑是一大福音。

其三,Nano Banana 2的角色与风格一致性达到了极致。只需提供一张照片,便可以在不同场景和动作中保持同一人物面部特征。据说准确率高达95%以上,同时支持上传多达14张参考图进行多图融合,为创作者提供了更多的创作空间。

其四,该模型还具备专业级的视频和静态图编辑功能。支持对话式微调和局部精准修改,可以原生输出2K到4K超高清分辨率的图像。这意味着,即使是普通用户,也可以轻松编辑出专业级别的图像作品。

与第一代相比,Nano Banana 2在基础架构、分辨率、文字能力、逻辑理解及参考图支持等方面均有显著提升。基础架构从Gemini 2.5 Flash升级至Gemini 3.1 Flash/Pro,分辨率也从约1K提升至原生2K/4K。值得一提的是,文字能力从曾经的乱码问题改进为能够精准渲染多国语言文字。逻辑理解方面也实现了升级,从仅按照提示词绘画发展为具备“思维链”和理解物理关系。参考图支持更是从数量有限扩展至支持多达14张参考图,为创作者提供了更丰富的创作素材。

Nano Banana 2的发布无疑将为用户带来前所未有的视觉体验。无论是设计师、艺术家还是普通用户,都可以轻松利用这一模型创造出令人惊叹的作品。

快递今日最新新闻【今天最新新闻】:转载请保留快递新闻网链接。