博海拾贝 文摘 不能困在数据里面,要能真正理解

不能困在数据里面,要能真正理解

@光头怪博士:刚刚知道 GPT 两个很好玩的 Bug:1. 很难生成人用左手写字的图片;2. 很难生成显示你想要的时间的钟表或者手表的照片,生成的时间大部分都是 10 点 10 分左右。

试了一下,用的是 GPT-4o。还真的是这样!怎么引导训诫都不管用

第一个很好理解:网上左撇子写字的照片太少了,在训练数据集里是高度 under-representative 的。

第二个对我是新知识:网上钟表和手表的照片很多都是广告,这些广告一般都会选择时针分针对称分开的 10 点 10 分作为展示时间,导致了显示这个时间的照片在训练数据里是严重 over-representative 的。上网搜了一下,还真是如此!

怎么说的,并不惊讶,但是这个程度。。。离所谓的 AGI 是不是有点儿远?

本文来自网络,不代表博海拾贝立场,转载请注明出处:https://www.bohaishibei.com/post/97265/
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
Telegram
返回顶部