第262章 新春座谈会 二(1/2)
技术研討的预演会刚结束,走廊里的气氛稍微鬆动了一些。
但紧接著,关於“產业发展政策”的第二场会前会已经准备就绪。由於两场会议之间有一个小时的空档,参会人员大多在休息区走动。徐辰作为上一场的技术顾问,需要等这一场的產业大佬们討论出落地框架后,再以顾问身份进去旁听。
就在这时,他在饮水机旁看到了梁文锋。
徐辰对这位神秘而低调的梁总很感兴趣,他主动走上前,礼貌地打了个招呼。
“梁总,你好。久仰大名,我是徐辰。”
梁文锋明显愣了一下,目光在徐辰脸上停留了半秒,隨即露出一丝理科生特有的、生硬却真诚的微笑。
“徐辰?你好。”隨后补充道,“你刚才会上发言很精彩。”
这是基本的客套,並不高明。毕竟刚才两人同席,互相的身份牌早就亮明了。
梁文锋对徐辰的印象很不错。作为deepseek的ceo,他每天的必修课就是像雷达一样扫描全球最新的技术趋势,自然不会漏掉那篇摘得icml杰出论文奖的论文,因此很早就注意到了徐辰这个名字。
而刚才在预演会上,徐辰面对一眾老牌专家的质疑,那种举重若轻的技术辩护,这位年轻的天才也已经彻底勾起了他的兴趣。
两人並肩向休息区走去。
梁文锋这种人,说话逻辑感极强,完全没有商人的圆滑。
“slrm那篇论文,我带著技术团队復现了部分逻辑。”梁文锋落座后,直接略过了所有的寒暄环节,直奔主题,“你在流形空间里做的逻辑拓扑降维,帮我们解决了一个困扰很久的『注意力弥散』问题。思路很漂亮。”
徐辰笑了笑:“梁总的deepseek也让我印象深刻,v3版本的moe架构优化得非常极致。”
梁文锋停下脚步,转过头,语气平淡却掷地有声:“有兴趣来deepseek吗?”
“嗯?”徐辰一愣,梁总聊天还真是直白啊。
“年薪800万。职位是首席ai科学家。”梁文锋盯著他,“不碰管理,不碰工程,你只负责基础原理层的数学模型调优。”
徐辰微微一怔。
800万,说实话,这个数字即便对於现在的他来说,也是一个极具衝击力的诱惑。但他很快清醒过来,他的主线任务在数学,在更深层的宇宙真理。
“谢谢梁总厚爱。”徐辰婉拒道,“但我接下来的重心在纯数学,下个月就要去法国萨克雷大学进修了。ai这边,我可能暂时只能作为兴趣研究。”
梁文锋並没有露出失望或不悦的神情。对於他这种人来说,行就行,不行就不行,没必要浪费时间在客套上。
“理解。”梁文锋点了点头,“纯数学確实比写代码有意思。”
……
两人坐在休息区的真皮沙发上,话题很快转到了技术本身。
“slrm解决了逻辑链条的確定性问题,但这只是第一步。”梁文锋看著窗外,眼神深邃,“目前的transformer架构,本质上是在用昂贵的神经网络计算去『模擬』知识检索。这太蠢了。”
这是一个业界公认却又无可奈何的“死穴”。
目前的大语言模型就像是一个博闻强识却没长记性的天才,就像每次做一道数学题,都要从公理系统开始重新推导一遍整个微积分体系,而不是直接调用脑子里的公式。
这种“即时重构”的模式,导致了恐怖的算力浪费。
本章未完,点击下一页继续阅读。