69书吧最新网址:www.69hao.com
首页 > 精品推荐 > 学霸的征途是星辰大海 > 第139章 新的SOTA

第139章 新的SOTA(1/2)

目录
好书推荐: 梁朝九皇子 救命!高冷女总裁赖在我家不走了 六零年代,冷清妍的逆光人生 四合院,傻柱你爸被你哥送去当兵 大唐:让你教太子,没让你套麻袋 四合院我能无限合成 人在玄幻,给我无限弹药什么鬼 末日车队,让子弹在公路上飞一会 序列车队:求生纪元 家族修仙:从打下小型位面开始

当晚,徐辰收到张乐阳发来的消息,语音里透著掩饰不住的兴奋,甚至连称呼都变了:

“徐神!搞定了!彻底收敛了!精度比我们预期的还要高两个百分点!老板刚才看了结果,高兴得差点没把桌子拍碎,直夸我们这次效率高!我跟老板提了一嘴是您帮忙改的算法,老板说改天一定要请您吃饭!”

紧接著,是一张截图。

图片上是校级计算中心的任务队列管理界面。

“我跟中心那边打好招呼了,我们课题组的帐號权限已经给你开通了。这是ssh密钥和ip位址。你直接远程登录就行,不用再跑一趟了。现在四张a100全空著,优先级调到了最高,你隨便造!”

“谢了,学长。”

徐辰回了个抱拳的表情。

这个忙也不算白帮,几个小时前,他还得排队填表看人脸色;现在,他手里握著物理学院国家重点项目的算力通道,享受著vip级別的待遇。

……

徐辰打开终端,输入指令,连接伺服器。

“来吧,laart,让我看看你的成色。”

他敲下了那行早已准备好的指令。

运行!

……

这个阶段是ai的训练阶段,在这个阶段,模型需要通过海量的文本数据,学习语言的语法、词汇之间的关联,以及基础的世界知识。

风扇的轰鸣声仿佛透过网络传了过来。

屏幕上,一行行日誌开始飞速滚动。

epoch 1/100 | loss: 2.4582 | accuracy: 12.4%

epoch 2/100 | loss: 1.8923 | accuracy: 28.7%...

起初,loss曲线的下降並不算快,这在徐辰的预料之中。因为laart模型引入了复杂的几何约束,模型在初期需要花费大量时间去“寻找”那些逻辑盒子在向量空间中的正確位置。

这就像是在玩拼图,刚开始总是最慢的。

徐辰没有盯著屏幕发呆,他起身给自己泡了杯咖啡,顺便看了会美剧。

两个小时后。

当他再次回到屏幕前时,终端里的数据已经发生了翻天覆地的变化。

epoch 50/100 | loss: 0.1245 | accuracy: 94.2%

“收敛速度比预想的要快。”

徐辰眉毛一挑。

普通的transformer模型在处理逻辑推理任务时,往往需要海量的数据“餵”进去,靠概率去“蒙”出逻辑关係,所以收敛极慢,且很容易过擬合。

但laart不一样。

它的“逻辑门控单元”就像是一个严厉的老师,一旦模型试图“瞎矇”,就会被几何约束狠狠地惩罚。这迫使模型必须去学习真正的因果链条,而不是统计规律。

“差不多了。”

徐辰终止了训练,保存了模型权重。

……

接下来,是见证奇蹟的时刻——推理测试。也就是看一下刚刚训练好的ai在实际推理上的成绩怎么样。

他打开了那个专门用来测试逻辑能力的clutrr数据集,隨机抽取了一道题输入模型。

context(上下文):“爱丽丝的丈夫是鲍勃。鲍勃的女儿是克莱尔。克莱尔的哥哥是大卫。大卫的儿子是艾瑞克。”

question(问题):“爱丽丝是艾瑞克的什么人?”

徐辰按下了回车。

如果是普通的gpt-3级別的模型,面对这种多跳推理,很容易因为“注意力分散”而答错,可能会回答“阿姨”或者“妈妈”。

屏幕上光標闪烁了0.1秒。

回答: grandmother (祖母)

逻辑路径:爱丽丝->(妻子)->鲍勃->(女儿)->克莱尔->(哥哥)->大卫->(儿子)->艾瑞克.

“漂亮!”

徐辰打了个响指。

不仅仅是答案正確,更重要的是那个逻辑路径。这说明模型不是在“猜”,而是在那个高维的几何空间里,真正地构建出了人物关係图谱,並通过向量运算,一步步推导出了结果!

……

但这只是单例测试,说明不了大问题。真正的考验,是全量数据集的泛化能力测试。

他首先进行了离线测试。也就是用clutrr数据集中,预先划分好的“验证集”来跑分。这部分数据模型在训练时是没见过的,可以初步检验模型的泛化能力。

他敲下了测试指令,看著进度条一点点向前推进。

趁著测试的空档,他打开了papers with code网站,搜索了clutrr数据集的最新排行榜。

排名第一的,是deepmind在半年前发布的neuro-symbolic gnn (v2),准確率达到了92.4%。这是一个专门为逻辑推理设计的、极其复杂的混合架构,號称融合了神经网络和符號ai的精髓。

本章未完,点击下一页继续阅读。

目录
新书推荐: 诛仙:我,逍遥剑仙,加入聊天群 斗罗聊天群:从曝光唐家父子开始 全网封杀?反手成为LPL严父! 异世召唤之雄图天下 四合院:从火车列车员开始 霍格沃茨:魔咒嫌我弱,连夜修仙 上交传送门,国家却要判我刑? 路明非不想拯救世界 三角洲:天生无惧,他们叫我顶护 穿越成假少爷,还得变身假面骑士
返回顶部