近日,科技部高新司在天津组织召开国家超算互联网工作启动会,会议发起成立了国家超算互联网联合体。科技部将通过超算互联网建设,打造国家算力底座,促进超算算力一体化运营,支撑数字中国建设“高速路”。超算互联网是用互联网思维运营超算,将全国众多超算中心通过算力网络连接起来,构建一体化算力服务平台,解决当前亟待突破的现有单体超算中心运营模式,以应对算力设施分布不均衡、接口不统一、应用软件自主研发和推广不足等问题。当前人工智能新一轮浪潮爆发,超级算力作为“AI军备竞赛”皇冠上的明珠重要性凸显。随着多地超算中心和大型数据中心建设升级项目兴起,助推超级计算市场迅速增长。根据Synergy Research Group数据,全球超级数据中心数量从2017年的390个增长至2022年二季度的659个,增长近一倍,预计2024年总数将超1000个。01
算力:人工智能核心底座
在人工智能发展的三要素中,数据与算法都离不开算力的支撑。根据OpenAI数据,ChatGPT浪潮下算力缺口巨大,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。大模型呈爆发态势(更多的参数/更大的算力芯片需求): 资料来源:英伟达官网现阶段算力规模重点包括基础算力、智能算力和超算算力三部分,分别提供基础通用计算、人工智能计算和科学工程计算。基础通用算力主要是基于CPU芯片的服务器所提供的计算能力。智能算力主要是基于GPU、FPGA、ASIC等芯片的加速计算平台提供人工智能训练和推理的计算能力。超算算力主要是基于超级计算机等高性能计算集群所提供的计算能力。
02
超算行业概览
超级计算,又称高性能计算(HPC),指利用并行工作的多台计算机系统(即超级计算机)的集中式计算资源,处理极端复杂或数据密集型问题。超级计算以每秒浮点运算次数衡量,Petaflops为度量单位,超级计算具备极强计算能力,其浮点运算速度达到千万亿次每秒。超级计算通过高性能的计算能力赋能数据回收与分析、数据模拟等场景,处理极端复杂或数据密集型问题;按照算力资源划分为尖端、通用、业务和人工智能超算四大类。构成超算中心的超级计算机每秒运算速度高达10亿亿次,其计算能力相当于200多万台普通计算机,能计算普通计算机和服务器不能完成的大型复杂计算。相比于数据中心分布式运行、以软件实现其扩展的模式,超算中心采用集中式的集群逻辑,耦合度高,单机性能好,其应用主要集中于高性能计算领域。超算目前主要提供国家高科技领域和尖端技术研究所需的运算速度和存储容量,专用性更高。近年来,中国不断强化统筹算力调度、建设若干国家枢纽节点和大数据中心集群,建设高性能计算机集群,部署超级计算中心,从而推动超算的发展。
我国国家超级计算中心是由国家科技部批准建立的数据计算机构。截止2022年底,国内已建成10家国家超级计算中心,分别是:国家超级计算天津中心:部署有“天河一号”超级计算机和“天河三号”原型机系统;国家超级计算长沙中心:拥有“天河一号”超级计算机;国家超级计算深圳中心:配备有曙光“星云”超级计算机;国家超级计算无锡中心:拥有中国首台全部采用国产处理器构建的“神威·太湖之光”超级计算机;国家超级计算郑州中心:配备了新一代高性能计算机“嵩山”超级计算机;国家超级计算昆山中心:将承接长三角区域大科学装置的先进计算及科学大数据处理服务;国家超级计算西安中心:应用领域广泛,从先进制造、芯片设计等科技前沿,到能源利用、天文物理等国家重大需求,均有涉及。 资料来源:国家超算、光大证券、行行查
03
超算产业链
超算产业链上游主要包括基础硬件、应用软件和配套设施资源;包括芯片、服务器、网络、存储、操作系统、管理软件、制冷设备和供电设备等。中游包括提供算力的超算供应商、超算整合中心和研究机构等,其中供应商市场规模稳步增长。 资料来源:头豹研究院
04
超算市场格局
在美国达拉斯举行的 SC22 会议上,公布了新一期「世界上最快的 500 台超级计算机」。Frontier、Fugaku 和 LUMI 计算机位列前三。其中,Frontier 计算机排名第一。该机型被称为“世界上第一个每秒浮点运算能力(FLOPS)达到百亿级别”的计算机系统。 图 | 排名第一的 Frontier 计算机(来源:资料图)Frontier 是由美国橡树岭国家实验室研发的超级计算机,其采用 HPE Cray EX235a 架构,配备了 AMD EPYC 64C 2GHz 处理器。中国有两台计算机入围此次榜单中的 TOP10,共有 162 台计算机入围 TOP 500 总榜单,数量稳居世界第一。由中国国家并行计算机工程技术研究中心(NRCPC)开发的“神威·太湖之光”计算机系统,安装在中国江苏省无锡市的国家超级计算中心,凭借 93Pflop/s 的运算速度排名第 7。中国国防科技大学开发的天河 -2a 系统部署在广州的国家超级计算机中心,凭借 61.4Pflop/s 的运算速度排名第 10。全球超级计算机制造数量整体呈增长态势,其中,中国和美国断层式位居世界前列。我国制造的超级计算机总体数量已经连续五年市场份额位居全球第一。从全球超级计算力数量来看,我国以173台位居全球第一;美国在算力方面位居全球第一。全球超算行业呈现高集中度,2022年6月超算制造量前十的制造厂商分别是:联想集团(161台,32.2%)、美国慧与、浪潮、源讯、中科曙光、戴尔、英伟达、富士通、NEC、华为。全球超算市场结构包括五个部分,其中服务器市场占比最大,其次是HPC存储。GPU
GPU是图形处理器的简称,它是一种专门用于处理图形、视频、游戏等高性能计算的硬件设备。在高性能计算服务器中,芯片成本占比高达51%,按照超算中GPU价值量占比80%计算,全球超算GPU市场约为96亿美元。根据用途和性能表现,GPU可以分为专业卡和消费级卡两类:其中,专业卡通常用于工程、科学、医学等领域的高性能计算和大规模数据处理,主要厂商包括英伟达、AMD等。随着英伟达A100、H100等型号产品的发布,GPU在算力方面的优势相较于其他硬件具有较大优势,GPU的工作也从一开始的图形处理逐步转化为计算。GPU数量和总算力的关系(GPU为英伟达A100): 资料来源:英伟达近年来,榜单上的高性能计算机主要使用英伟达的图形处理器,该处理器凭借更好的性能在 TOP 500 计算机中占比较大。但是,根据最新发布的榜单显示,AMD 图形处理器正逐渐占据主导地位,取代了英伟达。TOP500系统中有101个系统采用AMD处理器,例如排名第一的Frontier和排名第三的LUMI。2022年9月,美国针对AI、HPC及数据中心研发所用的高端GPU发出限制,英伟达的A100和H100以及AMD的MI250芯片暂停向中国客户销售。2022年10月,美国升级禁令限制范围,对高算力芯片的连接速度和每秒运算次数等具体参数做限制,除英伟达和AMD外,国内厂商海光信息的部分产品也被加入到限制范围内。其中,海光DCU属于GPGPU的一种,在典型应用场景下,海光深算一号指标达到国际上同类型高端产品的水平。
美国将制裁限制范围由应用场景扩大到芯片和产品层面,也代表着国内相关GPU产品或下游应用发展超过美国政府的预期。在海外监管趋严的背景下,以海光为代表的国产GPU厂商有望迎来高速发展期。长期来看,高速运算相关的国产厂商有望通过软硬件技术提升,加速高速计算芯片的国产化替代。该环节国内代表厂商包括:海光信息、景嘉微、龙芯中科、芯原股份、天数智芯、壁仞科技、寒武纪、燧原科技、沐曦、摩尔线程、芯动科技、深流微等。 资料来源:科创板日程加速器&协处理器:高算力最强辅助
在TOP500榜单中,总计有179个系统使用了加速器/协处理器技术。这些系统中的84个系统采用NVIDIAVolta芯片,64个系统采用NVIDIA Ampere。从TOP500看,由GPU和加速器共同组成的异构算力是上榜计算机的主流选项,加速器/协处理器技术的应用越来越普遍。虽然使用GPU,也可以起到加速的作用,但无法发挥最大的潜质。因此业界渴望一种硬件可被重新编程来执行新类型计算的芯片,这时,FPGA和ASIC便登上了舞台。异构多元算力是超级计算机在从传统的高性能计算向HPC与AI并重转变的具体体现。揭示了当今超级计算机的应用领域不仅仅是高性能计算,还涵盖了人工智能以及其他更为广泛的领域,并且具有研究与商业兼具的特点。因此可见,应用领域的拓展影响着超级计算机的发展,二者相辅相成。FPGA
FPGA和GPU内都有大量的计算单元,它们的计算能力都很强。在进行人工智能神经网络(CNN, RNN, DNN)运算的时候,两者的速度会比CPU快上数十倍以上。FPGA(Field Programmable Gate Array,现场可编程门阵列),是一种硬件可重新编程的半定制芯片。通过在硅片上预先设计具有可编程特性的集成电路,用户可根据具体需求将芯片编程成算法最期望的颜值。虽然FPGA比较灵活, 但其设计资源比GPU受到较大的限制。例如GPU如果想多加几个核心只要增加芯片面积就行,但FPGA一旦型号选定了逻辑资源上限就确定了。FPGA虽然在浮点运算速度, 增加芯片面积,及布线的通用性比GPU来得差,却在延迟性及功耗上对GPU有着显著优势。 资料来源:英特尔官网市场格局方面来看,海外厂商主导全球FPGA 市场,赛灵思和英特尔形成双头垄断。国内厂商主要包括复旦微电(高可靠FPGA 技术领先,率先推出亿门级FPGA 和PSoC 芯片,应用领域不断丰富)和紫光国微(国内特种集成电路行业领先者,产品覆盖500 多个品种,特种领域FPGA 持续更新)、安路科技(国内民用FPGA龙头)。国内AI芯片以寒武纪思元系列、华为昇腾系列等为代表,寒武纪和华为昇腾部分AI芯片产品性能已达到较高水平,有望加速实现国产替代,迎来高速发展期。ASIC
ASIC(Application Specific Integrated Circuit,应用型专用集成电路),是针对某种特定功能需求,设计、开发的专用类型芯片。这种针对固定算法的专用芯片,可以实现最佳计算能力、最优计算效率。其架构和指令集针对人工智能领域中的各类算法和应用作了专门优化,以使芯片在计算精度降低的情况下更耐用。随着算力逐渐增强,ASIC在人工智能训练端的应用场景也逐渐增多。与GPU和FPGA相比,基于某一算法定制的ASIC芯片可以实现体积更小,功耗更低,算力消耗更小。ASIC每瓦能为机器学习提供比所有商用GPU和FPGA更高的量级指令。由于ASIC开发周期长,仅有大厂有资金与实力进行研发。竞争空间上,传统的CPU领域有英特尔和高通;GPU领域有英伟达和AMD;FPGA中有赛灵思和Altera(英特尔收购)。唯有与AI计算最为定制化结合的ASIC领域尚未有绝对的垄断性龙头。目前市场上主流ASIC有TPU芯片、NPU芯片、VPU芯片以及BPU芯片,它们分别是由谷歌、寒武纪、英特尔以及地平线设计生产。除此之外各大云厂商、互联网厂商,如从百度AI业务分拆而来的昆仑芯,阿里平头哥,特斯拉以及比特大陆等也有涉猎。由ASIC是全定制芯片,在某些特定场景下运行效率最高,故某些场景下游市场空间足够大时,量产ASIC芯片可以实现丰厚的利润。05
超算“中国芯”崛起
1992年,“银河—Ⅱ”10亿次巨型计算机研制成功,1993年10月,在李国杰院士团队的努力下,中国自主研制出了我国第一台SMP(对称式多处理机)结构计算机——曙光一号计算机。2013年“天河二号”诞生,不仅缩小了与美国的差距,还挤入了全球第一梯队,登上了超级计算机排行榜榜首,这标志着中国的超级计算机技术已经进入了世界一流水平。天河超算在超算芯片上使用了自主设计的加速器取代了英特尔的加速器,天河2号使用国产加速器升级之后,性能提升了70%以上。2015年美国封锁超算芯片出口,仅过一年,我国自主研发的超级计算机芯片—“申威”横空出世。申威SW26010是中国首个采用国产自研架构且性能达到世界一流的计算机芯片。2016年6月20日,搭载申威SW26010的神威·太湖之光拿下来全球超级计算机第一的位置,并且实现了4连冠,神威·太湖之光更是世界上首台峰值计算速度超过十亿亿次的超级计算机,其峰值计算速度达每秒12.54亿亿次。神威·太湖之光的出现标志着中国在超级计算机领域已经可以实现全面自研,除了“神威”系列之外,“天河”系列超级计算机已经全面掌握“五大”自主核心技术,即具有自主知识产权的四大芯片和自主操作系统。而“曙光”系列目前也已经实现了国产替代。2019年,美国制裁海光集成电路、成都海光微电子技术、中科曙光、无锡江南计算技术研究所、天津海光这5家超算企业。这5家超算企业在国内的研究方向都是偏向超级计算机以及芯片研究方向。目前国内顶级超算已经多采用自主设计研发的加速器芯片,实现芯片的国产化。近年来我国还在积极研发E级超算,实现对美国的绝对领先。E级超算是指每秒可进行百亿亿次数学运算的超级计算机,是国际上高端信息技术创新和竞争的制高点,被全世界公认为“超级计算机界的下一顶皇冠”。我国已经有三台E级超算原型机已经交付。“天河三号E级原型机系统”实现了四大自主创新,神威E级使用的正是申威研发的新一代申威26010+众核处理器,曙光E级也使用的是国产芯片。“天河三号”原型机采用自主的飞腾处理器、天河高速互联通信和麒麟操作系统,实现了芯片的全国产化。 资料来源:澎湃网除了国家队主导的超算之外,民企的算力中心发展速度也非常快,例如阿里云的张北超级智算中心,总算力高达12EFlops,一举超过了9 EFlops的谷歌和1.8 EFlops的特斯拉。按照计划,到2025年年底,国家超算互联网将可形成技术先进、模式创新、服务优质、生态完善的总体布局,有效支撑原始科学创新、重大工程突破,成为支撑数字中国建设的“高速路”。未来超级计算中心与云计算、互联网技术融合,有望从精密研制、信息安全、和科学计算领域向生命健康、传媒娱乐、金融分析及等各领域拓展应用,有望迎来高速发展。
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。