异动
登录注册
请教墨芯人工智能的稀疏算力
埃尔德本地化
中线波段的龙头选手
2023-04-07 17:28:41
800GCPO、LPO市场上最亮眼的存在,无惧上涨;

本质上是算力大爆发下的强需求驱动,海外大厂订单满满,不断刺激市场正向反馈;

昨天墨芯人工智能发布了夺冠一事,这里面有很多不明白的知识点,有知道的朋友欢迎赐教;感谢!

转载自:   墨芯蝉联MLPerf冠军,稀疏计算释放大模型应用潜力 

请教CPO的朋友们,从行业和服务器部署的角度看,墨芯的产品是不会可以进行产业化应用?

或者说墨芯的产品,只是算力芯片部署的一个点,没有形成一套完善的解决方案,从压制了其产品的大规模应用;单一产品和成熟的解决方案还是有很大的不同;

 

下面引用一部分公司的算力说明:

1:墨芯S40计算卡首次亮相MLPerf,在数据中心的图像任务主流模型ResNet-50上夺得冠军,算力达127,375 FPS。S40计算卡性能达到英伟达H100、A100的1.4倍和2.9倍。

2:墨芯S40计算卡比上届冠军S30计算卡的算力增幅达33%,体现出持续的产品性能提升能力。与上一次MLPerf相比,墨芯产品相较H100和A100的算力优势分别扩大了20%和90%。

3:墨芯30计算卡获得ResNet-50模型“整机4卡”冠军,算力383,520 FPS,达英伟达H100的4卡成绩的1.8倍,并且超过英伟达A100的8卡成绩。

4:墨芯人工智能创始人兼CEO王维在出席活动时透露:在墨芯内测中,在与GPT-3参数相当的开源LLM——1760亿参数的BLOOM上,4张墨芯S30计算卡在仅采用中低倍稀疏率的情况下,就能实现25 tokens/s的内容生成速度,超过8张A100。

请教CPO的朋友们,从行业和服务器部署的角度看,墨芯的产品是不会可以进行产业化应用?

或者说墨芯的产品,只是算力芯片部署的一个点,没有形成一套完善的解决方案,从压制了其产品的大规模应用;单一产品和成熟的解决方案还是有很大的不同;

 

 最后附上王维总的部分观点:

王维指出,大模型时代的算力痛点主要集中在两点:首先是大算力,大模型参数呈指数级增长,算力需求爆发,产生巨大的算力缺口;另一方面是加快推理速度,由于生成式AI基本都是在线应用,系统对于用户的需求要在毫秒内快速响应。


“微创新是大公司做的事情。大模型参数已经突破万亿、并且持续增大,微创新无法根本解决问题。创业公司要做就做有数量级突破的颠覆式创新。墨芯成立之初,我们就看到了:稀疏计算能够带来数量级的性能增长。因此我们一直笃定,做一家稀疏计算公司。”王维表示。此次墨芯在MLPerf的连续夺冠,正是用实际证明了稀疏计算的巨大应用价值,以“12nm战胜4nm”的成绩打开新的算力增长空间。


墨芯的判断,与业界、学界对稀疏计算的看好是相一致的:大模型浪潮开启后,稀疏计算相关研究活跃度显著提升。学界与业界都积极将稀疏计算作为大模型算力破解的重要方向,例如谷歌对AI的终极愿景——Pathways架构采用稀疏计算原理:执行任务时仅稀疏激活模型的特定部分,计算真正有用的元素,这正是稀疏计算的本质。


王维表示,墨芯AI计算卡发布数月就已实现量产,在互联网等领域成单落地。ChatGPT走红后墨芯也收到大量客户问询,了解稀疏计算在大模型上的算力优势与巨大潜力。

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内可能择机卖出。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
浪潮信息
S
新易盛
S
中际旭创
工分
2.10
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(3)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-04-07 17:49
    我觉得墨芯芯片是用于在计算卡上,组合在服务器某个节点上的加速计算能力的功能,属于景上添花。
    0
    0
    打赏
    回复
    投诉
    于2023-04-07 17:55:06更新
    查看1条回复
  • 只看TA
    2023-04-07 22:05
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往