本文转发,来自北证三板研习社
1、并行科技的GPU超算集群是最适合大模型训练的算力
大模型训练是当前最热的风口,而想要成功训练好大模型,其背后所需要的算力非常之高。之所以要求高,也是因为大模型跑一次就需要巨大的成本,因此这个过程中维持长周期、稳定可靠的计算环境来保障计算任务不中断显得非常重要,如果算力不达标,发生故障后在时间、精力和成本方面的代价都很高。
目前市面上存在三种训练架构和资源:
1) 云计算架构。这种主要是分布式架构,主流的云计算服务器之间的网络带宽在200Gbps。而大模型的一些训练需求服务器之间的互联网带宽一般要求达到3200Gbps,两者相差十几倍,因此在性能方面云计算无法满足大模型训练的需求;
2) 超算CPU资源。CPU资源主要用于处理通用计算任务,具有高灵活性,但是在处理图像和图形等任务时的效率显著低于GPU,同样无法满足大模型训练的需求;
3) 超算GPU资源。大规模GPU超算集群就是将大量 GPU 资源组成算力集群来应对极高的密集性计算,其浮点运算速度能够达到千万亿次每秒,同时具备高速互联计算网络、高性能文件存储和强劲的 GPU 算力,是更适合大模型训练场景的。
并行科技的智算云也就是超算GPU资源,不仅具有建设运维“0”成本的优势,而且系统内预装了大量的应用,按照不同的使用场景进行分类,极大方便了用户的使用,在服务方面,公司提供专家团队7x24小时服务,对使用者来说,免除后顾之忧。
在GPU算力紧缺的当下,公司拥有或者能调度多少GPU算力资源成为当下“供不应求”市场环境下的关键要点。
2、子公司北龙超云是北京超算中心实际运营商
公司自有的GPU资源确实不多,2022年显示为229.33万卡时,大致折合下来也就小几百卡。但是公司持股55%的子公司北龙超云是北京超级云计算中心的实际运营商。北京超算中心成立于 2011 年,是由北京市人民政府和中国科学院院市共建,运营主体为北龙超云。
北龙超云由并行科技、中国科学院、北京怀柔区政府共同持股,三家分别持有55%、35%、10%。可见北京超算云是并行科技所主导的,这一点不管是在资源调度和人员上都有明显的体现。
资源调度方面,从北京超算云官网登录后所看到的系统界面除了部分介绍文字不一样之外,其他功能与从并行科技官网登录后看到的基本完全相同,而且在该页面上方置顶的是“祝贺并行科技11月1日北交所上市,股票代码839493。
在并行官网网速测试所显示的可调度资源中,则包括北京超算中心多个N字开头的GPU资源集群,由此可见两家关系紧密程度非同一般,并行科技是可以调度北京超算中心的GPU资源的。
人员配置方面,北京超算中心总经理吴迪,CTO甄亚楠既是公司员工持股平台的出资人,也是公司最近一期30元/股股权激励的授予人和上市战配中拿真金白银大比例认购的出资人。所以名义上北京超算中心的主体运营股东包括中国科学院和怀柔区政府,实际上都是并行自己的人,因此实际上北京超算中心是由并行科技来实际运营的。
弄清楚这之间的关系,接下来需要搞明白的就是,北京超算中心这棵大树究竟实力如何以及并行科技如何在这个运营过程中分一杯羹。
根据北京超算中心官网介绍,2020年、2021年、2022年,北京超算连续三年入围中国HPC TOP前100,连续三次获得“通用CPU算力性能第一名”。同时在2021年AIPerf500榜单中,北京超算10套AI算力系统上榜,获得总量份额第一名。2022年总投资29亿元的北京超算(二期)启动筹备。那么具体有多少GPU卡呢?根据官方公众号所披露的信息,其现阶段拥有2万余张基于超算架构的大模型GPU算力卡,从今年7月起,还计划上线11720余张A800算力卡,以及19000余张H800算力卡,合计3万余张。
根据NVIDIA网站数据,A800单卡GPU算力为0.625P,H800单卡GPU算力为2P,按照公司计划采购的3万余张计算对应约4.5万P算力。假设公司已有的2万余张GPU算力卡为A800和H800各一半,对应现有算力约2.6万P算力。
作为实际运营公司,并行又怎么和业主合作呢?根据并行科技公众号其董事长陈健博士所介绍,其模式为由超算中心或者运营商购买算力,公司做总包运营,通过合作分成的方式获取利润。而这种分成机制不同于收固定的运营费用,我们认为将可能给公司业绩未来带来较大的弹性。
就单说北京超算中心2万多张GPU卡,量的方面未来还要新增3万余张,价的方面,GPU卡现阶段供不应求,市场需求紧俏,价高者得,在禁售的情况下未来看涨的概率高。分成机制下将有望带动公司北龙超云业绩提升。
从北龙2022年半年报和2023年净利润对标看,2022年净利润只有不到200万元,2023年达到了1351万元。
那么这种分成比例大概是多少呢,我们猜测可能在10%左右,根据公开新闻报道,2021年北京超算中心营收突破10亿元,当年度北龙超云的营收是1.22亿元,大致是一个10%的比例。
从商业层面来讲,这样的合作也是双方优势互补,具有持续性。对超算中心而言,并行科技作为专业的超算运营商,熟悉市场,具有响应服务快,运营能力强的优势,能够帮助超算中心投资的资源利用率最大化。对并行而言,公司现阶段难以大规模持续投入建设GPU资源,通过调度资源来实现人才的培养,经验的积累,轻资产创造收益,有助于公司盈利能力提升。
而且这种模式是可以复制到其他超算中心的,从并行官网所显示的调度网络上看,GPU资源还包括宁夏超级云计算中心和中国国家网格。
3、并行科技与A股其他公司所掌握的算力资源对比
在供需失衡下,目前A股算力租赁相关公司均实现股价的大涨,其逻辑大致为根据规划的算力和算力进展进行定价。根据国泰君安统计,恒润股份、鸿博股份、真视通、创业黑马算力情况大致如下图所示。
若将其算力资源和市值逐一对应来看,恒润股份远期规划4万P,在手算力2500P,市值提升额约90亿元,鸿博股份规划1万P,9月份完成3000P对应市值提升额约135亿元。其他几家也基本按照进展和规划予以相应的定价。并行科技的情况则是实际运营的北京超算中心拥有约2.6万P,规划4.5万P,若按照10%分成,对应并行科技可按照在手2600P,规划4500P进行定价,按照沪深的逻辑对应市值提升额约90亿元。而这还并未算公司可调度的其他GPU超算资源,公司目前在北交所总市值仅有不到30亿元,若按沪深A股定价逻辑或存在显著低估。
综上,并行科技由于在超算云行业内先进的调度能力和技术积累,成熟的服务模式,公司不仅是一家拥有大量CPU自有资源的公司,还是一家能调度2.6万P+GPU算力资源,未来调度4.5万P+GPU资源的大模型算力运营商,通过与业主的分成机制,公司将可能以轻资产投入享受到大模型时代GPU量价齐升的行业红利。