o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2
o1满血版泄露了!血版泄露
没想到,奥数OpenAI还搁那儿“今年一定”呢,题图特不少网友已经率先上手体验到了(doge)。片推
事情是理手酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,拿把大家伙儿还都能卡bug直接用!掐奥
最初发现此事的剧透网友,测试确认泄露模型具有奥特曼所说的血版泄露图像推理能力。
△图源:@legit_rumors
而日志也显示该模型就是奥数o1本模。
于是题图特,赶在OpenAI出手修复之前,片推网友们抓紧大玩特玩了一波——
满血o1到底有多牛
和已经发布的理手o1-preview、o1-mini最直观的拿把不同是,泄露出来的掐奥o1支持上传附件。
这也就意味着,终于能测测o1的多模态能力了。
网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。
对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。
思考了18秒之后,o1给出答案:18。
答案正确:
再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。
在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。
不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。
ID为anagh的网友,给泄露模型和GPT-4o做了个同屏对比:4o速度很快,给出了错误答案19。
而满血o1花了1分39秒,狂刷一堆token……给出了不同的错误答案:29。
正确答案是24。
这个bug现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整3个小时。
不小心还是故意的?
有网友犀利地点出,这事儿看上去不是“不小心”,而是“精心策划”:
目的是让人们对即将发布的模型有一个预期。
不少网友赞同这样的观点:
奥特曼的目的是测试和炒作。
而由于一切看上去已经部署就绪,甚至有人猜测,o1完整版的正式上线时间就在未来一周之内。
值得注意的是,就在这次泄露事件之后,奥特曼马上在??上开始了自己的表演:
好家伙,都已经吹上o2的风了(还假装上错号……)。
至于为什么是这个时间……
那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛(doge)。
参考链接:
[1]https://x.com/legit_rumors/status/1852625385801859321
[2]https://x.com/koltregaskes/status/1852657291469709626
[3]https://x.com/anaghnairr/status/1852668741751919016
- ·《龙腾世纪:影障守护者》总监称下次会让玩家过去的选择更有意义
- ·10999元 微星尊爵13 AI+ Evo笔记本上市:990g轻薄设计
- ·双双里程碑!巴雷拉、德弗里一同迎来国米生涯250场里程碑
- ·尤文赚翻了!花小钱办大事:700万签顶级边锋,2球4助闪耀欧冠
- ·[流言板]邮报:据信萨卡是腿筋撕裂,甚至有可能会伤缺至3月初
- ·奥哈拉:若圣诞节后热刺仍位居第十,澳波会被列维解雇
- ·接口速度5.6 GT/s、超400层!三星将推出第10代V
- ·REDMI K80系列10天销量突破100万台!刷新K系列最快破百万纪录
- ·[流言板]大逆转?波普接球中投命中,魔术抹平20分分差反超热火1分
- ·曼城各项赛事遭遇客场5连败,队史上一次遭遇6连败是在1994年
- ·格列兹曼用进球帮效力球队拿到131分,西甲历史所有球员中第4多
- ·阿斯:小将阿森西奥对利物浦表现出色,获皇马一致认可+超预期
- ·小红书商业化发布“AIPS人群资产模型” 种草度量形成完整方案
- ·科斯米:北方三强能应对多线作战,那不勒斯不会因无欧战获得优势
- ·奥哈拉:若圣诞节后热刺仍位居第十,澳波会被列维解雇
- ·《宝可梦TCG Pocket》发布仅三周 全球总收入已超过1.2亿美元
- ·发现一位足坛美女:瑞士女甲联赛踢球的Eleni Rittmann
- ·不受待见!劳塔罗双冠+双金靴,FIFA最佳提名、最佳阵候选都没进
- ·奥哈拉:若圣诞节后热刺仍位居第十,澳波会被列维解雇
- ·苹果史上最薄手机!iPhone 17 Air厚度曝光:6.25mm
- ·微盟集团:积极响应商务部行动计划 助力批发零售业数字化发展
- ·记者质疑孔蒂用人:主力和替补区别太大,很多球员场均不足10分钟
- ·[流言板]找回准心!詹姆斯命中第5记三分砍30分三双,湖人再反超1分
- ·屡战屡败,西媒曝安切洛蒂面临被解雇风险
- ·不手洗、不晾晒!小熊电器双舱洗衣机:分区洗脱烘全搞定
- ·[流言板]拼尽全力!恩比德全场空砍35分11篮板2助攻1抢断2封盖