热天中文网

第508章 处於领先全球的大气层&好日子(第1页)

天才一秒记住【热天中文网】地址:https://www.rtzw.net

第508章处於领先全球的大气层!

&好日子~

看著屏幕中列出的一项项数据,洛川忍不住咧开嘴巴。

稳了~

骄阳200单卡fp16算力高达7.92tfl0ps!

对比一下同期顶尖產品。

英伟达於今年3月份刚推出的geforcegtx680,单卡算力仅有3.09tflops。

不过二者的属性稍有不同。

后者是通用gpu,设计目標是,兼顾游戏渲染与通用计算,在3d建模、科学计算等场景中,兼容性更强。

而骄阳200为ai算力卡,仅针对ai算子优化,如矩阵乘法、lsttm门控运算等。

在通用浮点运算和图形渲染管线效率上,要弱於gtx680不少。

但在ai的核心战场,深度学习训练与推理等垂直领域,骄阳200却有著代际领先!

基於存算一体架构,骄阳200的数据传输延迟,低至15ns!

內存带宽高达1tbs!

而gtx680,延迟高达200ns,內存带宽约192gbs。

以模型训练为例。

后者需频繁在显存与与计算单元间搬运权重数据,每叠代100步,便因数据搬运,浪费28秒。

而骄阳200可实现“数据不动计算动”

,同等任务下,计算效率提升4.7倍!

此外,通过骄阳200內置的“自注意力並行计算单元”

,针对transformer的qkv矩阵乘法设计,可实现硬体级加速。

单卡每秒可处理2.1万亿次注意力计算!

gtx680仅0.4万亿次。

在在bert—base模型推理中,单卡qps,即每秒查询率达1.2万!

是gtx680的3.8倍!

功耗方面。

骄阳200的存算一体架构,使单卡功耗控制在220w,稍低於gtx680的195w。

但算力功耗比达36.4gflopsw,后者仅有15.8gflopsw。

在7x24小时不间断运行的情况下,8卡骄阳200集群,年耗电量较gtx680集群减少120

万度!

集群扩展性方面。

基於洛先知亲自主导研发的“晶片间高速通信协议+“云—芯协同”

协议+高速总线”

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

世子的小青梅作且娇十二星云录绑定天才就变强和天下第一的隐居生活(美食)江湖风云第一刀蒸汽朋克下的神秘世界小神仙,请留步国师的萌徒娇又野少年王我在八零靠脑洞破案[刑侦]被手下卷成皇帝穿成农家福宝小甜妻女配艳光四射魏武侯好运的九零年代星临诸天无限之神话逆袭骗了康熙高门主母穿成豪门女配三爷宠妻甜蜜蜜要修仙就上一百层养成女友从梦境游戏开始剑开福地洞天这个大佬是凡人我在魔界种田