,空芯反谐振光纤或将成 为新一代 AI 算力集群通信传输 技术
一:
算力超跑配专业赛道:
什么是NVLink,NVSwitch
(NVLink这是一种超快的芯片到芯片互连互通技术,将允许定制芯片连贯地互连到公司的 GPU、CPU、DPU、NIC和 SoC。)
(NVSwitch并非作为取代NVLink的技术,而是使两组NVLink共16颗GPU能够互相具备全速沟通通道的手段;在设计上,NVLink被加在每两组GPU之间,两组NVLink则在透过高速通道连接。)
一、0-1
最新 AI 服务器中高算力 GPU 之间互联速率大幅提升,或将对传统传输技术提出 挑战。
(英伟达在 3 月 22 日的 GTC 大会上发布最新 AI 服务器系统 NVIDIA DGX H100 以及 NVLINK 架构,DGX H100 配备 8 个 H100 GPU 模组,并且配备 Transformer 引擎,总 GPU 显存高达 640GB。
每个 H100 GPU 配备 18 个 NVLink, 确保 GPU 之间的双向带宽高达 900GB/s,GPU 之间通过 NVIDIA Switch 彼此互 联,DGX 配备 4 个 NVSwitches,GPU 之间双向带宽为 7.2TB/s,比上一代性能 提高 1.5 倍。
NVSwitch 可以连接多个 NVLink,在单节点内和节点间实现以 NVLink 能够达到的最高速度进行多对多 GPU 通信。NVSwitch+NVLink 可以实现纵向扩 展来训练万亿参数模型,这些 GPU 拥有高达 15 petaFLOPS每秒千万亿次浮点运算的深度学习计算性 能。
DGX H100 服务器可利用 NVLink 来提高可扩展性,进而实现超快速的深度学 习训练。
在核心算力硬件性能大幅提升的背景下,即使升级到 800G 光模块来进行 服务器之间的数据传输,传统光纤的损耗延时或将对数据传输效率施加压力。)
二、1-10
COMPUTEX台北电脑展 2023 上,NVIDIA黄仁勋 发布了 NVIDIA DGX GH200,这标志着 GPU 加速计算的又一次突破,为要求最苛刻的巨型 AI 工作负载提供支持。
1)GH200 不是芯片,是最新的DGX超级计算机,最大可以放256颗GPU,我们之前熟知的云厂商租赁出来的DGX服务器 内搭8颗DPU。
2)GH200最显著的特点是适用于超大型ai模型的部署,我们熟知的GPT3.5 就不能放在一台普通DGX上,不同DGX之间靠通信链接,现在GH200 将内存彻底打开,提供线性拓展方式。GPU 共享内存编程模型可通过 NVLink 高速访问 144 TB 内存,比上一代DGX内存多了500倍。DGX GH200架构提供的NVLink带宽是上一代的48倍。这样万亿参数以上大模型都可以在一台DGX内放置,有利于模型提升效率,也有利于多模态模型开发进步。
三:优缺点
空芯反谐振光纤将降低传统光纤损耗延时等问题,提高 AI 服务器的数据传输效率。l 传统玻璃光纤在材料的吸收、色散、非线性、低损伤阈值等方面的限制,在光纤通 信、高功率激光输出、超快光学、非线性光学等领域的应用上出现限制。空芯光纤 改变了光在光纤中的传输介质,能够将光限制在空气芯纤芯中进行传输,并且从根 本上避免了由于传统光纤在材料本征限制而带来的问题。
空芯光纤有三大优点:1)低延时,空气折射率为 1,光在空芯光线中的传输速度是光速,远远超过在玻璃介 质中传输速度;2)低色散,空芯光纤的材料色散要低于实芯光纤三个数量级;3)低非线性;4)高激光损伤阈值,空芯光纤由于可以实现超过 99%的光功率在空气 中传输,光场与材料重叠极小,在相同的传输功率下有更低的材料吸收,拥有更高 的激光损伤阈值,以至于减少光纤损伤。
微软在 2022 年年底宣布收购空心光纤厂 商 Lumenisity,以提升自身的云计算基础设施能力,Lumenisity 的空心光纤已经 应用在 euNetworks 公司在英国伦敦和巴西尔登之间 14km 长的对金融交易至关 重要的数据中心互联上,空芯光纤技术逐渐得到市场的认可,在中短期之内或将开 启商业化进程。在国内市场方面,长飞光纤正在布局空芯反谐振光纤,在 AI 数据 中心加速部署的趋势下,长飞光纤的空芯反谐振光纤有望加速市场化并且加速渗透 进入 AI 数据中心互联以及 AI 服务器互联场景。在 AI 算力的持续热度下,长飞光 纤有望持续受益。
四、用量大
【中银通信】【长飞光纤】空芯反谐振光纤龙头,唯一最接近量产的A股标的
微软认证的新一代通信技术:
2022年12月,微软以9000万美金收购Lumenisity,该公司实现了空芯反谐振光纤量产突破。
[庆祝]空芯光纤是提高数据传输速率的革命性技术:
该技术保障光信号可以在真空环境中传输,与传统光纤相比具备低延时、低损耗、高带宽的特性。
[庆祝]AI算力网络是该产品重要应用场景:
AI服务器除了要求单卡性能外,还要求多卡间的通讯性能,例如采用PCI3.0协议通信的P2P最大带宽达到32GB/s,但是仍然达不到所需的带宽要求。英伟达为此专门开发了NVLINK架构以及DGX系统,使得芯片间的双向带宽可达160GB/s,因此英伟达需要800G的光模块来完成硬件布局以支持对应的超高带宽的DGX系统,传统光纤的损耗延时依旧造成传输的浪费,空芯光纤将成为绝佳的解决方案!
目前,空芯反谐振光纤产业推进难点是如何落地量产,长飞光纤是最先突破并接近规模量产的公司。
推荐:300548博创科技 601869长飞光纤
688143长盈博