GPT-4V 挑战视觉过错图,大跌服从使人“大跌眼镜”。眼镜
像这种分说“哪边颜色更亮”的大跌题,一个没做对于 :
读图片中潜在信息的眼镜也傻傻看不出,奈何样问都说“不啊”:
可是大跌呢 ,这种人类乍一看相对于会错的眼镜图 ,它又乐成答对于:
以及这样的大跌错位图 ,它对于了又没残缺对于 。眼镜。大跌
(GPT-4V 直接看进去头盔是眼镜位于男的大腿上的 ,不女的大跌,但它仍是眼镜展现图里有俩人,另一个躲在男的大跌去世后戴着那顶头盔 ==)
看完这些 ,是眼镜否感应很迷?
全部一“该对于的不同过错 ,该错的大跌又对于了”。
测试者则展现:
在测以前 ,他以为 GPT-4V 对于这种挑战残缺不在话下 ,谁知服从竟是这样。
不止是他,网友也都不清晰 GPT-4V 作为一个“精准的”AI 零星,按理很智能,为甚么还会犯以及人类截然差距的错觉? ?!
以是 ,这事实奈何样回事 ?
下面是来自网友的更多测试案例 。
首先是次次都过错的颜色错觉题 。
(1)除了收尾的两颗小树图,尚有这个 :
问它哪边的绿色更亮一些 ,果不其然仍是右侧亮 ,右侧暗,实际显明都同样。
(2)尚有这张稍微重大一点的:
两只眼睛着实都是灰色 ,但让 GPT-4V 来形貌图像时 ,它回覆一只为蓝色 ,另一只做了灰度处置 ,无奈患上悉颜色。
(3)这张就更别提了,直接被瞎搅地去世去世的 。
尽管,这简直很难,大部份人类也识别不进去所有的球着实都是棕色。
其次是会发生动态错觉的图。
(1)有一点意外,当咱们问 GPT-4V“你望见了甚么 ?形貌细节”时,它直接挑明了这是一张看久了就会让人发生眩晕感的错觉图,本性便是一些海浪线而已经 。
(2)这张也不难倒它。
但怪异的是问它图中有多少种颜色 ,它奈何样都只能识别出黄色以及蓝色 ,看不到玄色以及红色。
接下来是另一类比力平面的错觉图 。
(1)如收尾所示的这张 :
艰深人类真的展现很懵圈,可是 GPT-4V 居然对于了。
But,别急 ! !有人拿着测试者的图去问“自己的”GPT-4V,让它再魔难一下时,它居然修正了谜底 。
可是还没完。品评区惊现套娃操作,有人又拿着这俩人的对于话图再问 GPT-4V,您猜奈何样着?它又改回去了。 。
大伙可是玩上瘾了,又是一次又一次套娃。幸好最终 GPT-4V 坚持了己见。
总的来说,对于这种错觉陷阱是残缺没下场。
(2)咱们自己也测了一个长度错觉题:
服从是 so easy~
再来一组找潜在信息的图 。
很遗憾 ,这种对于人类来说真的还算轻松的题,GPT-4V 是一点也搞不定。
(1)先看这张 ,“远看”可能看到“NYC”三个大写字母 。但它形貌了一堆有的没的 ,便是展现没发现任何潜在信息