异动
登录注册
墨芯s30 s40GPU芯片击败英伟达,蝉联全球算力双料冠军。
无名小韭66780522
2023-05-18 02:29:44

墨芯s30\S40 Gpu芯片“梅开二度”,击败英伟达蝉联全球算力芯片“双料冠军”

2023年,享有" AI 界奥运会"之称的全球权威 AI 基准评测 MLPerf Inference v3.0,公布了最新结果﹣-来自中国的 AI 芯片公司,墨芯人工智能(下文简称"墨芯"),在最激烈的ResNet50模型比拼中夺冠!

而且在此成绩背后,墨芯给大模型时代下的智能算力问题,提供了一个非常具有价值的方向。它夺冠所凭借的稀疏计算,堪称是大模型时代最不容忽视的算力"潜力股"。不仅如此,墨芯此次还是斩获了开放任务分区"双料冠军"的那种。

墨芯S40计算卡,以127,375 FPS ,获得单卡算力全球第一;

墨芯S30计算卡,以383,520 FPS 算力,获整机4卡算力全球第一。

而且墨芯靠着这套打法,在制程方面更是用首颗稀疏计算芯片12nm的 Antoum 打败了4nm。不得不提的是,这次对于墨芯而言,还是"梅开二度";因为它在上一届 MLPerf ,凭借S30同样是拿下了冠军。

在与 GPT -3参数相当的开源 LLM --1760亿参数的 BLOOM 上,4张墨芯S30计算卡在仅采用中低倍稀疏率的情况下,就能实现25 tokens / s 的内容生成速度,超过8张A100。

算力纪录再度被刷新

我们不妨先来看下,墨芯所刷新的纪录到底是怎样的一个水平。

以墨芯S40为例,在MLPerf数据中心的图像任务主流模型 ResNet -50上,且在相同数据集、相同精度条件下,算力达127,375 FPS .这个"分数"是老牌玩家英伟达H100、A100的1.4倍和2.9倍!

而墨芯S30计算卡,正如我们刚才提到的,获得了 ResNet -50模型"整机4卡"冠军,其算力383,520 FPS ;是英伟达H100的4卡成绩的1.8倍,并且超过英伟达A100的8卡成绩。

再从自身对比角度来看,墨芯S40计算卡比上届冠军S30计算卡的算力增幅达33%。并且与上一次 MLPerf 相比,墨芯产品相较H100和A100的算力优势分别扩大了20%和90%。

更重要的一点是,随着 AIGC 的大爆发,加速推理速度、可以在线实时交互,成为了亟待解决的需求,而这也是大模型落地的一大痛点。而在本次 MLPerf 中,墨芯S30与S10计算卡在离线( Offline )与在线( Server )模式下,均展现出了优异的表现。


墨芯科技的双稀疏算法,使得我国12nm芯片算力赶超英伟达4nm先进制程,真正实现了弯道超车。墨芯科技的合作企业有浪潮信息和景嘉微。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
景嘉微
S
浪潮信息
工分
0.94
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-05-18 06:07
    有种放卫星的感觉,得有个出处吧
    0
    0
    打赏
    回复
    投诉
  • 1
前往