热天中文网

第630章 卡脖子(第1页)

天才一秒记住【热天中文网】地址:https://www.rtzw.net

穿过北疆科大的校门,越过两栋教学楼,实验室里,李泽和姜伊伊安安静静地坐在门口的位置。

虽然是周末,但吴晓忠的实验室却没有休息。

“老师,这次我只微调了150个参数,可这任务卡在99%已经两天了,咱们实验室的算力什么时候能增加一些?”

吴晓忠的学生王楠在一旁抱怨道。

他也不想周末泡在实验室,可手里的任务一直在延迟,倒不是他代码写的慢,而是实验室的算力实在是不够用。

吴晓忠主攻的就是AI大模型,之前接受李泽的投资,大模型研发有了长足的进展。

甚至已经有了很多成果落地。

可在继续迭代的过程又遇到了问题,数据工程、架构创新等基础都已经做到极致。

可问题就出现在调参训练上,实验室的硬件有限,每次跑任务都要等上几天。

写代码只要一小时,可等任务却超过了3天。

吴晓忠的大模型在这样的效率下,不仅没有掉出第一梯队,还能跟上世界先进水平,已经很不容易了。

要知道,现在的大模型动不动就上亿级别的参数,每次只优化几百个,这效率可想而知。

“困难总是有的,想办法克服就是了,等熬过这一段时间,一切都会好的。”

吴晓忠出言安慰道。

他也不是没做出改变,模型架构已经优化到极致,kv缓存压缩至十分之一,长上下文显存占用降低90%。

分布式、无辅助损失负载均衡、双向流水线,能想到的都想到了,可问题是底层的硬件底座不够给力。

用的显卡是几年前的旧款,数量和质量都不尽如意,也不是他不想更新。

实在是丑国封杀得严,高端显卡禁运,吴晓忠想买也买不到。

想订购国内最新款自研显卡,可是产能又不够,那些大公司都吃不饱,他一个小实验室想抢到训练用的显卡太难了。

无奈,只能用时间来换,争取每次调参的代码准确性高一些,避免出现返工的问题。

又查看了几个学生的任务,吴晓忠慢慢走到李泽的身前。

这是他第二次见李泽,上次还是在海浪汽车的厂里,测试自动驾驶模型的时候。

他对李泽的印象很深,是个聪明孩子,而且还是李尚海的儿子,大家都亲切地称呼李泽为小李总。

“小李总,今天怎么有空来这里玩,是不是想提前感受一下大学的氛围?”

“吴教授,我这次来是有点事想请教你的。”

“哦?”

吴晓忠饶有兴趣地盯着李泽,一个小学生有问题请教他一个大学教授,多少令人有点好奇。

“说说看,有什么是要请教的?”

吴晓忠随便拉了把椅子,坐在李泽的对面。

“是这样的,我想问问有哪些高科技是丑国有的,我们又急需的。”

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

在各个世界当爸爸[快穿]木叶的恶霸忍猫红楼宠妻狂魔史上最强邪君回归后我令反派闻风丧胆快穿之女配打脸人生上瘾四合院开局从三级钳工开始快穿攻略女配要黑化非典型求生欲[快穿]仙门万年:开局获得大道法穿越我是小锦鲤我,腕豪,海军大将重生成偏执霍少的小仙女论警校组和守护蛋的适配程度重生1990:姐,我回来了藏锋咒术界的泥石流替嫁医妃硬核宠夫大唐黑脸神大数据修仙忍界传说,木叶签到五年柯南之从聊天群开始穿书反派:锦鲤她靠玄学爆红了狩猎在1986