OpenAI“草莓”落地了?ChatGPT惊现神秘GPT-4o模型,网友热议:新版本提升不多,但逻辑推理有改进

当地时间8月13日,OpenAI的聊天机器人账号@ChatGPTapp发文宣布,自上周以来,ChatGPT上了一个新的GPT-4o模型。

根据该账号的回帖,新上线的ChatGPT-4o模型并不是上周发布的API端GPT-4o 0806模型,目前该模型也对免费用户开放,不过有使用次数的限制。

这一消息立刻引发了网友的热议与猜测:难道这就是传说中的“草莓”项目?之所以网友的热情如此之高,是因为“草莓”项目的前身是Q*算法模型,Q*能够解决棘手的科学和数学问题。如果AI模型掌握了数学能力,将拥有更强的推理能力,甚至与人类智能相媲美。

然而,在随后的测试中,网友们发现新模型与原来的版本相比,没有太大改善,也未能通过经典的草莓单词测试,不过在逻辑推理方面还是有所改进。

GPT-4o家族上新 “草莓”落地?

网友的激动并非毫无缘由。

新模型发布的前一周,OpenAI CEO阿尔特曼在X上发布了一张花园里的草莓照片,网友随即联想到了OpenAI团队此前被爆出的一个名为“草莓(Strawberry)”的项目。但对于评论区的猜测,阿尔特曼本人没有证实,也没有否认,只是确认这张照片拍的是他现实中的花园。

而后,ChatGPT账号发了一个草莓表情,OpenAI员工特里弗·克里奇发了餐盘上的草莓图片,以及爆料人@iruletheworldmo也频繁更新,几乎次次都与草莓相关,这些似乎都指向了一个可能即将揭晓的重要时刻。

因此,当ChatGPT账号宣布GPT-4o家族更新,网友们的情绪和讨论也达到了高点,这一更新是否就是“草莓”的落地?

不过,随着测试信息的披露,网友发现,这一更新并没能满足他们的预期。而且,对于新模型的具体改进和新功能,OpenAI却出奇地保持了沉默。

一系列测试显示,新模型与之前的模型相比并没有太大的改善。在经典的草莓单词测试中,新模型还是出现了错误。大多数测试者反馈称,他们并没有感受到明显的性能提升。有的网友甚至直言根本分不清楚新版本和旧版本到底有什么区别。

但本次更新并非没有亮点。一些用户指出,新模型在逻辑推理方面有所改进,例如它不再轻易陷入逻辑循环。另外,新模型的响应速度也比之前的版本快了不少。

有网友还总结出了新旧模型之间的三点差异:一是输出风格略有不同,其次推理略有改进,不再陷入循环,最后是更加亲切,更愿意探索其存在的哲学层面(更少机器人化,更像Claude)。但是他也承认新旧模型之间的差异不大。

来源:X

AI发展背后的安全挑战

对于这些评论,ChatGPT的回复是:“还有很多工作要做,我们正在努力。”至于新更新是否是备受关注的“草莓”,外界依然不得而知。

之所以网友们的热情如此高涨,是因为“草莓”项目的前身是Q*算法模型,Q*能够解决棘手的科学和数学问题。如果AI模型掌握了数学能力,将拥有更强的推理能力,甚至与人类智能相媲美。而这一点是目前的大语言模型还无法做到的。

尽管这一方法有可能使模型在智能上实现质的飞跃,但其伴随的危险性也不容忽视。正如斯坦福大学教授、STaR技术的开发者之一Noah Goodman所言:“这种技术潜力巨大,但同时也伴随着相当大的风险。”

据外媒此前报道,“草莓”项目的训练涉及对经过后期训练的模型(这些模型已经针对特定用途或应用进行了有效的后期训练)进行最终微调。这一过程类似于斯坦福大学的自学推理机(STaR)技术。STaR技术允许AI模型通过反复创建自己的训练数据,“引导”自己进入更高的智能水平,理论上可以让语言模型达到超越人类的智能水平。

值得注意的是,OpenAI此前多次因安全问题而受到质疑。今年7月,OpenAI的一名内部人士向美国证券交易委员会(SEC)投诉,指控公司通过非法限制性保密协议限制员工对外披露与公司技术潜在安全问题相关的信息。更早之前,OpenAI原超级对齐团队负责人Jane Leike在离职后也指责公司忽视安全文化,只注重“闪亮的产品”而非安全。

而在8月9日,OpenAI发布了一篇关于安全性的博客文章,详细介绍了公司在开发ChatGPT用户的旗舰模型GPT-4o时所做的安全努力,并探讨了这些技术可能对社会带来的风险。

OpenAI警告称,用户可能会与AI建立社会关系,进而减少对人际交往的需求——这或许对孤独的人有益,但也可能影响健康的社会关系。与AI的长期互动甚至可能影响社会规范,比如,模型允许用户随时打断和“拿走麦克风”,这种行为虽然对AI来说理所当然,但在人际交往中却显得粗鲁。

在谈到GPT-4o的早期测试时,OpenAI透露,他们观察到用户与模型的互动语言开始出现微妙的变化,例如,表达共同纽带的语言,“这是我们在一起的最后一天”等等。这种看似无害的行为,背后可能隐藏着更大的问题。

此外,OpenAI还提到,GPT-4o有时会无意间生成模仿用户声音的输出。换句话说,它可能被用来冒充他人,从而被利用进行犯罪活动。

记者|文巧 实习记者|岳楚鹏

编辑|孙志成 兰素英 杜恒峰

校对|王月龙

|每日经济新闻 nbdnews 原创文章|

未经许可禁止转载、摘编、复制及镜像等使用

每日经济新闻

平台声明:该文观点仅代表作者本人,号外财经仅提供信息存储空间服务。发布者:号外财经,转转请注明出处:https://www.qinjiong.com/2024/08/14/10889.html

(0)
号外财经的头像号外财经
上一篇 2024年8月14日 下午2:40
下一篇 2024年8月14日 下午2:40

相关推荐

  • 李殿仁:弘扬长征精神,切实做好当下

    长征的史诗属于历史,也属于现在和未来。走好我们自己的长征路上可告慰先辈在天之灵,下可为后人做个样儿,自己也能心底坦荡,不枉英雄气概男儿胸襟。   从1934年10月至1936年10月,红军第一第二第四方面军和第二十五军进行伟大的长征,是人类历史上的伟大创举。长征留给我们最可贵的精神财富,就是中国共产党和红军将士用生命和热血铸成的伟大长征精神。这个精神概括起来…

    2024年8月26日
    2900
  • 中国“00后” 金光闪闪耀巴黎

    金光闪闪的巴黎大皇宫里,一位身穿白色击剑服的香港姑娘正挥舞着手中的利剑,如同一位优雅的芭蕾舞者在舞台上翩翩起舞。这位姑娘就是江旻憓,她刚刚为香港摘下了2024年巴黎奥运会的首枚金牌,也是香港奥运史上的第三枚金牌! 想象一下,当江旻憓最后一剑刺中对手时,整个比赛场地瞬间沸腾了!观众们欢呼雀跃,仿佛看到了一只小蚂蚁成功地搬走了一块比自己大十倍的糖果。没错,江旻憓…

    2024年8月8日
    4400
  • 淘宝京东正式“拆墙”,重构双11新战局

    在“双11”的硝烟弥漫之际,10月16日,中国电商领域的两大巨头传来重磅消息,京东物流与淘天集团正式达成合作,京东物流将全面接入淘宝天猫平台。 这意味着,淘宝天猫的商家在之后发货时多了一个可以“送货上门”的选项——京东物流,消费者在退换货环节也可以享受京东物流的“上门揽收”服务。 京东相关人士告诉时代周报记者,目前双方对接系统已基本完成,消费者也可以在淘宝和…

    2024年10月17日
    3000
  • 重庆多地官宣延迟开学

    因持续晴热高温天气,8月28日,重庆市北碚区、梁平区、奉节县教育委员会发布通知、公告,相继将2024年秋季中小学(幼儿园)正式开学时间调整至9月9日。 2024年8月24日,重庆涪陵,小朋友在美心红酒小镇水上乐园戏水消暑。视觉中国 图 《重庆市北碚区教育委员会关于2024年秋季学期全区中小学(幼儿园)延期行课的通知》要求,因持续晴热高温天气,为切实保障全区中…

    2024年8月29日
    4700
  • 欧洲金靴|“中华民族最危险的时候”已经过去了?《义勇军进行曲》过时了?

    长征并沒有结束,我们这个民族还有很长很长的路要走! 前面还会有一道道封锁线,还会有湘江,烏江,金沙江,大渡河……还会有娄山关,腊子口,还会有雪山,草地……   因为胜利,党内的骄傲情绪,以功臣自居的情绪,停顿起来不求进步的情绪,贪图享乐不愿再过艰苦生活的情绪,可能生长。   因为胜利,人民感谢我们,资产阶级也会出来捧场。   敌人的武力是不能征服我们的,这点…

    2024年8月8日
    4700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信