第169章 重启SLRM研究 五(2/2)
而外界的公眾和投资者,则被这场“狼人杀”搞得热血沸腾,对即將到来的gpt-5发布会,期待值直接拉满。
“这肯定是gpt-5的预热!”
“openai这是在憋大招啊!先用神秘帐號屠榜,然后发布会上直接揭晓,这剧本绝了!”
“我已经准备好充会员了!gpt-5快来吧!”
……
一周后。
万眾瞩目的openai开发者大会,如期举行。
舞台上,灯光璀璨。
山姆·奥特曼穿著標誌性的灰色t恤,走到了舞台中央。
虽然他脸上掛著自信的微笑,但只有他自己知道,此刻他的手心里全是汗。
外界的期待已经被那个该死的“x”拉到了平流层。
所有人都以为他要掏出一个逻辑推理能力逆天、能秒杀一切的“神级模型”。
但实际上……
“今天,我们带来了gpt-5。”
奥特曼的声音有些乾涩。
大屏幕上,gpt-5的各项参数和演示视频开始播放。
更快的响应速度、更长的上下文窗口、更强的多模態能力……
一切看起来都很美好。
但是,当演示到逻辑推理环节时,尷尬的事情发生了。
虽然gpt-5在gsm8k上的得分也提升到了85%左右,但在logiqa和proofwriter这种纯逻辑任务上,提升幅度却微乎其微,甚至在某些复杂场景下,依然会出现明显的“幻觉”。
更糟糕的是,为了强行提升逻辑能力,openai在rlhf阶段引入了大量的逻辑数据进行微调,导致模型在日常对话中变得更加“机械”、“冷漠”,失去了gpt-4那种討人喜欢的“人情味”。
直播弹幕里,原本狂热的气氛开始冷却。
“就这?”
“那个屠榜的x呢?怎么没看到?”
“感觉跟gpt-4没啥区別啊,甚至说话更像机器人了。”
“失望,退钱!”
……
发布会后的记者问答环节,气氛更是尖锐到了极点。
一位来自《纽约时报》的记者,直接站起来,拋出了那个所有人都想问的问题:
“奥特曼先生,最近在各大榜单上屠榜的神秘模型『x』,是否就是gpt-5的某个內部版本?为什么我们在今天的演示中,没有看到那种令人震撼的逻辑推理能力?”
奥特曼的嘴角抽搐了一下。
他早就料到了会有这一问。
他深吸一口气,露出了一个高深莫测的笑容。
“关於『x』……”
他故意停顿了一下,目光扫过全场。
“我们openai一直致力於探索agi的边界。我们在內部確实有许多正在研发中的、具有不同特性的实验性模型。”
“gpt-5是我们目前认为最平衡、最適合推向市场的產品。至於其他的技术路径……”
他耸了耸肩,摊开双手。
“未来,一切皆有可能。”
这番话,说了等於没说。
既没有承认x是他们,也没有否认。
典型的“顾左右而言他”。
虽然公眾对gpt-5的表现略有微词,但在奥特曼这番“画饼”操作下,openai的股价在盘后依然坚挺。
只有奥特曼自己,回到后台后,瘫坐在沙发上,长长地嘆了口气。
“这个x……到底是谁啊?”
……