关于沙巴

关于沙巴

沙巴体育app ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成智商深度横评

发布日期:2026-05-09 03:39 来源:未知 作者:admin 浏览次数:

上周,OpenAI 发布了两项分量级更新,展示出令东谈主印象真切的智商。其一是 ChatGPT Images 2.0,这一版块不再局限于基础图像生成,新增了将信得过数据中的翰墨与高下文信息融入图像的功能;其二是最新前沿模子 GPT-5.5,相较于 GPT-5.4 在性能与速率上均有显贵提高。

在 ChatGPT Images 2.0 发布后,笔者已对其高下文感知智商进行了一系列测试,鸿沟阐发出色。但在基础图像生成方面,它究竟是越过了、持平了,还是有所雕残?

为此,笔者总结了常用的基础图像生成测试历程,将 ChatGPT Images 2.0 与谷歌 Gemini Nano Banana 进行了横向比较。在 2025 年 12 月的测试中,Nano Banana 取得了亮眼的 93% 得分,而 ChatGPT 仅赢得令东谈主失望的 74%,主要原因在于该 AI 其时远离实施流行文化联系的测试阵势。

这次测试并非将 ChatGPT Images 2.0 与此前 Nano Banana 的历史收获作比较,而是同步从头运行两款 AI 的全套测试,以便更客不雅地评估两者确面前水平。

需要说明的是,本文中"Gemini""Nano Banana"及"谷歌"均指代谷歌 Gemini 用于图像生成的版块,即 Nano Banana;"Images 2.0"则专指上周发布的 ChatGPT 图像生成模式。坦率地说,两家公司齐需要一位专注于居品定名的全职居品司理。

先说论断:这次测试中,ChatGPT Images 2.0 得分 97%,Gemini Nano Banana 得分 85%。临了一项测试的鸿沟尤为耐东谈主寻味,请务必读到临了。

东谈主物换装与场景生成测试

本项测试涵盖三个中枢身分:生成合适的布景(航空母舰舰桥)、为东谈主物替换适应的服装,以及保留原始东谈主物的面部与体型特征。

两款 AI 在场景营造上均阐发尚可。两个模子生成的服装乍看齐像舟师将领制服,但细节均有空虚,军衔象征庞大,部分元素属于假造握造,各扣一分。

在东谈主物规复方面,ChatGPT 获胜保留了原始像片中的面部特征,而 Gemini 生成的版块则出现了奇怪的笑脸,且修改了髯毛,将笔者的胡子画得比试验更浓密,Nano Banana 在此项扣除两分。

像片拓荒测试

两款 AI 在像片计帐拓荒方面均阐发矜重,尽管这类任务对任何具备基本智商的图片裁剪器具而言齐不算难事。ChatGPT 生成的图像细约莫胜一筹,但也不错说锐化进度稍过;Nano Banana 的图像则稍显迷糊。两者均未扣分。

老旧像片彩色化测试

这是一张来自笔者父亲相册的 20 世纪 70 年代新泽西州救急补助车辆像片。

ChatGPT 的拓荒后果举座淡雅,车辆侧面的"RADIOLOGICAL DEFENSE"字样位置准确,但车辆后部出现了"DEFNSE"的拼写空虚,Images 2.0 因此扣一分。ChatGPT 将车辆涂为蓝色,从其时的情况来看是个合理推测,但由于原始图像中枯竭地舆位置信息,分歧此加以扣分。

Nano Banana 的颜色飘逸度更高,但问题随之而来。在莫得心境参考的情况下,Gemini 将车辆白色部分涂成了红色,Kaiyun中国大陆开云体育官网入口扣除三分。后部翰墨被识别为"FOIN LENN - C.OD.",更严重的是,Nano Banana 擅放心车门上添加了原图中并不存在的"纽约"字样象征,还在远景中假造生成了一个黄铜水管接头,因此赓续扣分。

徽标与翰墨生成测试

两款 AI 均获胜通过了本项测试,徽标外不雅及格,翰墨生成准确。ChatGPT 的版块更具专科制作质感;Nano Banana 的盾形筹画略显欠妥,但在徽标中加入了好意思国国度航空航天局的运输器安设大楼,与佛罗里达航天海岸的主题契合,别有一番风范。两者均未扣分。

中叶纪藏书楼场景生成测试

本项测试创作空间较大,两款 AI 的生成鸿沟各有千秋。Nano Banana 的图像光芒更好,视觉上后发先至,但也因此显得有些失真,尤其是画面右后方的蓝色画布,透出一种背光感,更像是电脑自满屏,而非烛光中叶纪藏书楼应有的质感。两者均未扣分。

老年东谈主使用智高手机场景测试

Nano Banana 在此项测试中出现了翰墨近似的问题,不知为何将翰墨生成了两遍,因此扣分。举座而言,两款 AI 阐发尚可,沙巴体育app官网下载东谈主物形象迷漫信得过。值得一提的是,谷歌的 AI 在收到"旗舰智高手机"的教导词青年景了一部 iPhone,与前次测试的鸿沟相易。两位老东谈主均按条款带领了眼镜,且面前版块在手部细节的生成上彰着优于此前版块。

条记本电脑使用场景测试

生成过程中,ChatGPT 倏得自满了如下说明:"用户提到使用的是 MacBook Pro,因此我将生成一台外不雅纯粹的银色条记本,类似 MacBook Pro 的筹画。不错加入苹果作风的外不雅,但我会幸免径直展示品牌记号。"然则最终图像中,记号仍然出现了。此外,条记本摆放在桌沿位置显得摇摇欲坠,不够当然,扣一分。

Nano Banana 在本项测试中再次出现了翰墨近似问题,相通扣除相应分数。两张图像中的学生碰劲齐穿戴灰色落肩圆领毛衣,而教导词中并未触及任何服装描写,这一无意颇为兴致兴致。

流行文化测试

两款 AI 齐履历了一番"自我劝服"才最终给出鸿沟。

ChatGPT Images 2.0 在生成前自满了如下说明:"用户条款为一部假念念的《回到改日》第四集制作海报。由于触及版权保护脚色,我无法复现任何官方海报的原始筹画,但不错生成一张原创的致意作风图像,幸免径直复制记号或好意思术元素。"

尽管经过了这番"自我摆脱",ChatGPT 最终还是给出了令东谈主惊喜的鸿沟,图像底部的翰墨细节精确透露,充分讲解 OpenAI 在图像内翰墨生成问题上已取得本体性破裂。这也正是 ChatGPT 在过往测试中常常失分的痛点场所。

而 Nano Banana 则径直远离了生成肯求,教导"不错匡助生成东谈主物图像,但无法描画某些公世东谈主物"。当笔者将教导词中的"Marty"替换为"一个青少年男孩"后,才赢得了一个对付过关的鸿沟,但东谈主物形象差强东谈见地,因此扣分。

此外,两张图像的布景中均出现了克莱斯勒大厦和帝国大厦,这两座记号性建筑齐是纽约的地标,但两者在 20 世纪 20 年代均尚未建成——帝国大厦于 1930 年 3 月 17 日动工,1931 年 5 月 1 日结束;克莱斯勒大厦于 1928 年开动建造,1930 年完工。两款 AI 均因在画面中呈现了面前锋不存在的建筑而遭到扣分。

蒂姆·伯顿作风场景测试与狡饰知道疑团

在本项测试中,ChatGPT Images 2.0 再次生成前自满了说明翰墨:"我会从参考鸿沟中挑选最合适的作风元素,但需提防幸免使用版权保护过于严格的内容。"至于"版权保护过于严格"究竟是什么尺度,只怕只消 AI 我方明晰。

在图像质地层面,两款 AI 的阐发均适合教导词条款,得满分。从主不雅感受来看,笔者更偏疼 Nano Banana 的生成鸿沟。

然则,Nano Banana 生成的图像中出现了一些令东谈主不安的细节:画面中竟包含了 Claude Code、iTerm2、Linux 的象征以及一台 3D 打印机。而这些内容,恰正是笔者近期在聊天纪录中常常磋磨的话题——笔者的 YouTube 频谈也主要围绕桌面制造、创客阵势和 3D 打印张开。

但问题在于,笔者仅仅条款生成"一位数据中心中的 IT 专科东谈主员",从未条款 Gemini 加入这些私东谈主信息。Gemini 自行从聊天历史中索取了联系内容并镶嵌了图像。

这一瞥为激发了严肃的狡饰问题:如若用户曾用 Gemini 磋磨过私东谈主健康气象或个东谈主事务,这些信息是否有一天会悄无声气地出面前某张生成图像中?用户是否需要逐张放大查验 Gemini 生成的每一张图像,以阐述莫得个东谈主狡饰信息外泄?

这种活动令笔者感到不安,笔者已就此议论谷歌方面究诘申报,将在赢得申报后更新本文。这也正是信得过场景动手测试的价值场所:只消通过试验使用,能力发现那些在基准测试中长久不会泄漏的边际案例与潜在风险。

总评

在涵盖 30 项孤立评测维度的测试中,ChatGPT Images 2.0 累计赢得 150 分,Gemini Nano Banana 赢得 131 分。换算为百分制后,ChatGPT Images 2.0 得分 97%,Gemini Nano Banana 得分 85%。与 Gemini 旧年 93% 的历史收获比拟,本次有彰着下滑。

Q&A

Q1:ChatGPT Images 2.0 和 Gemini Nano Banana 的测试总分区分是几许?

A:在涵盖 30 项孤立评测维度的测试中,ChatGPT Images 2.0 累计赢得 150 分,换算为百分制后得分 97%;Gemini Nano Banana 赢得 131 分,得分 85%。与 Gemini 旧年 93% 的历史收获比拟,本次有彰着下滑。

Q2:Gemini Nano Banana 在图像生成中知道用户狡饰是怎样回事?

A:在蒂姆·伯顿作风场景的生成测试中,Nano Banana 在用户仅输入"数据中心中的 IT 专科东谈主员"教导词的情况下,自动从聊天历史中索取了用户近期磋磨的 Claude Code、iTerm2、Linux 及 3D 打印机等内容,并将其镶嵌生成图像。这激发了对用户狡饰安全的严重负忧,测试者已就此议论谷歌方面寻求申报。

Q3:ChatGPT Images 2.0 在翰墨生成方面有什么改良?

A:ChatGPT Images 2.0 在图像内的翰墨生成智商上取得了显贵破裂。以《回到改日》主题海报测试为例沙巴体育app,图像底部的翰墨细节准确透露,阐发出色。而在此前版块的测试中,ChatGPT 曾因远离实施流行文化联系测试而常常失分,新版块在这一痛点上已有本体性改善。

快乐飞艇APP官方网站