本地时间8月26日
google发布了其最新的
图象天生及编纂模子
Gemini 2.5 Flash Image
(代号“Nano Banana”纳米喷鼻蕉)
模子一经发布
便激发广泛存眷
按照google官方表述
Gemini 2.5 Flash Image
焦点亮点是图象编纂能力
这一模子可以将多张图象
混淆到一张图象中
连结高度的脚色一致性
还有能利用天然语言
举行有针对于性的修改
并充实使用Gemini的“常识贮备”
来天生及编纂图象

Gemini 2.5 Flash Image于文生图与图象编纂两个场景均位列榜首
图源:36氪
除了了脚色一致性
于衬着文本方面
该模子可以正确天生
包罗清楚易读且位置合理的
文本的图片
于物理常识方面
模子体现也较为精彩
按照google的案例
向模子输入
气球飘向神仙掌的图象后
提醒其
想象天生下一个可能的环境
从画面来看
模子可以或许预判
气球爆炸后的物理特性

有媒体报导称
该模子各方面体现可谓优异
不管是脚色的一致性
提醒词的追随
物理逻辑的真实性
还有是画面审美方面
都连结了水准

针对于深度伪造图象日趋增多
致使用户难以鉴别
收集信息真实性的问题
google为AI天生的图象
添加视觉水印
并于元数据中嵌入标识信息
有业内子士暗示
这次google新模子的发布
不仅是一次技能进级
或者将帮忙google缩小
与OpenAI之间的差距
参考:杭州日报、第一财经、腾讯新闻、36氪
-JDB电子中国区