博客什么是Google Nano Banana?谷歌的秘密AI图像工具
返回博客

什么是Google Nano Banana?谷歌的秘密AI图像工具

谷歌正在各平台秘密测试Nano Banana - 一个可能改变一切的革命性AI图像编辑模型

Gemini 图像工作室团队Gemini 图像工作室团队
·
什么是Google Nano Banana?谷歌的秘密AI图像工具

AI图像生成领域正在发生一些奇怪的事情。一个奇怪的名字,Nano Banana,开始在论坛、Discord和AI测试网站上浮现。没有公告。没有官方文档。只是一个开始碾压其他所有图像生成器的模型。

名字很奇怪。性能却不是。

许多人现在相信这是谷歌在生成媒体领域的下一个重大步骤,虽然他们还没有确认,但迹象无处不在。如果你关心AI艺术、编辑工具,或者只是想知道图像生成的发展方向,这个很重要。

首次发现:LMArena和香蕉热潮

Nano Banana首次出现在一个名为LMArena的网站上,这是一个不同AI模型在"战斗模式"中匿名竞争的地方。

你输入一个提示,两个匿名模型尝试生成最佳结果。关键是:你不知道哪个是哪个。

随着时间的推移,用户开始注意到一个模型与众不同。更好。它能保持面部一致。它理解上下文。它可以接受复杂的指令并真正遵循它们。很快,Reddit帖子和Discord服务器充满了猜测:谁在背后?

然后人们注意到一个主题。提示中的香蕉图标。输出样本上的香蕉图像。甚至一些谷歌工程师在X(前Twitter)上开始发布香蕉表情符号,没有任何解释。

就在那时,Nano Banana这个名字开始流传。

它有什么不同?

这不仅仅是炒作。Nano Banana在控制、一致性和场景逻辑方面做了其他模型难以做到的事情。以下是它的独特之处:

1. 通过语言编辑,而不是图层

你不需要Photoshop技能。你不需要绘制蒙版或修饰任何东西。只需用纯文本描述你想要改变的内容,比如"删除背景并用森林替换",或"让她微笑并添加柔和的光线",它就会自己搞定。

大多数其他模型要么弄乱细节,要么需要多次尝试。Nano Banana通常第一次就能做对。

2. 真正有效的身份保持

问任何AI艺术家什么最快破坏沉浸感,他们会说:"每次编辑时角色都在变化。"Nano Banana似乎明白了。你可以更换背景、改变角度、调整颜色,图像中的人或物体保持不变。

这意味着一致的头像、漫画、网红照片、产品拍摄,无需从头重建图像。

3. 真的很快

当其他工具为每张图像旋转10-15秒时,Nano Banana通常在1-2秒内响应。有时甚至更快。感觉就像实时工作,而不是批处理模式。

4. 多图像编辑和叙事

你可以向它提供多个相关的提示或图像,它会保持风格和叙事的一致性。这是即使是更大、更有名的模型仍然会出错的地方。这使得它对于创建一致场景、UGC、漫画、广告活动或幻灯片的创作者极其有用。

但它是谷歌的吗?

没有人正式说过。不是谷歌。不是DeepMind。但很多事情都指向那个方向。

该模型的行为类似于Gemini最近的多模态发布。这种做法——隐秘发布,无品牌,让社区自己搞清楚——感觉就像DeepMind在匿名基准竞技场中测试早期LLM的方式。

**第二:**几位与谷歌有关的开发者在社交媒体上发布了香蕉相关内容。他们要么在戏弄AI社区,要么在暗示。

第三:Nano Banana太好了,不可能来自车库团队。性能,特别是在角色一致性、场景感知和语言跟随方面,感觉像是来自前3个实验室之一。目前唯一能够达到这种质量水平的是OpenAI、谷歌,也许还有Anthropic。但这不像Claude。这感觉像是拿着画笔的Gemini。

实际应用:人们在用它做什么

这不仅仅是个玩具。它已经在改变不同行业团队的工作流程:

这些都不是假设的。这些是团队在封闭测试版或通过Flux AI和LMArena等非官方渠道测试模型时报告的数字。

在哪里可以试用

在Pollo AI查看:https://pollo.ai/

**亮点:**Pollo AI的订阅者可以享受无限使用

另一个选择是Google Gemini:gemini.google.com

它并不完美

一些早期用户指出了奇怪的行为、随机扭曲、奇怪的光线、面部变形。其他人说模型有时会误解提示,特别是模糊的提示。这是意料之中的。还早。

另外:访问不可靠。网站会宕机。模型有时会被替换或限制。这还不是商业产品,更像是你可以触摸的泄露。

为什么重要

Nano Banana,如果真的来自谷歌,标志着一个转变。

这不仅仅是生成漂亮的图像。这是关于替换整个编辑工作流程。不再需要切片蒙版。不再需要版本图层。不再需要批量渲染。只需告诉模型要做什么,然后快速得到结果。

这不是用于艺术的Midjourney。这是可能严重挑战Photoshop、Canva,甚至未来After Effects等工具的东西。AI不仅仅是生成——它在编辑保持样式化响应人类指导。

最后的想法

谷歌一直很安静。香蕉却没有。无论Nano Banana是否成为完整产品,还是只是Gemini未来的测试案例,有一点很清楚:

这东西不是为了玩而建的。
它是为了工作而建的。

相关文章