Q1:AI服务器需求爆发下,为什么说800G光模块是一个大节点,为什么不是400G?
(1)首先,A服务器对于底层数据的传输速率和时延要求非常高,对应的架顶交换机需匹配底层的数据传输带宽,且可能还需有时延冗余,需要高速率光模块匹配。例如英伟达DGX H100 服务器,配有8个H100 GPU模组,假设每个GPU需要2个200G光模块,则每台服务器内部至少是16个200G,对应架顶交换机端口则至少需要4个800G。
(2)其次,800G光芯片更具有经济性和性价比。800G采用100G EML芯片,而200G/400G所采用的是50G光芯片,经测算相同速率下,100G光芯片成本较2颗50G光芯片成本可降低30%。
Q2:什么是LPO?为什么说LPO是目前AI服务器最有性价比、最具落地性的800G方案?
LPO(Linear-drive Pluggable Optics)是线性驱动可插拨光模块,在数据链路中只使用线性模拟元件,无CDR或DSP的设计方案。相较DSP方案,LPO可大幅度减少系统功耗和时延(功耗相较DSP可下降接近50%),而系统误码率和传输距离有所牺牲,深度契合目前AI计算中心的短距离大带宽低功耗低时延的数据连接需求。
Q3:如何看待云计算厂商今年资本开支放缓?会影响800G光模块的导入节奏吗?
23年是云计算资本开支低点,北美4大云厂商在20-22年资本开支经历了快速增长(20-22年增速为17%/10%/14%),云计算建设有些提前释放,且一些云厂商在目前经济环境下有压力。但随着AI算力需求爆发,未来2-3年云计算厂商将加大算力数据投入,且今年下半年资本开支存在超预期可能。
不会影响。23年光模块市场规模增长的放缓更多来自于成熟速率光模块价格的下跌而非需求量的下降,各大云计算厂商对于光模块的总体需求仍在增长。未来3年AI算力缺口10倍,各大云巨头纷纷抢先下注AI服务器,预计23年800G需求为70-90万只,呈爆发式增长。
LPO是一种新技术,剑桥、海信等厂商刚发布产品,预计今年年底或明年才能实现量产。LPO是基于Linear Driver芯片技术实现的可插拔光模块。目前主流的200G/400G/800G的产品都是基于PAM4的技术加上DSP芯片来实现高速、高调制的信号恢复和传输。为了降低系统功耗,LPO光模块使用的TIA、Driver芯片性能提升,实现更好的线性度,从而并去掉DSP。
目前主流高速光模块通过DSP实现性号恢复,从而达到低误码率。DSP就是高速数字处理芯片,除了提供CDR能提供的数字时钟恢复功能之外,还可以进行色散补偿操作,去除噪声、非线性干扰等因素。DSP优势是具有很强的信号恢复能力,劣势是成本高(800G光模块中DSP要几十美金)、延迟大、功耗高、发热明显。
现在通过LPO线性直驱的技术把DSP替换,系统成本功耗、延迟提升,但是系统误码率和传输距离有所牺牲。所以LPO只适用于特定领域(短距离,比如服务器到架顶交换机之间的连接)。此外,LPO技术也需要依赖交换机芯片性能的提升,如T51.2T的Tomahawk5在信号恢复方面的功能提升。我们判断,未来LPO技术将逐步应用于最高不超过500m的短距离传输场景中。
Q:LPO相比传统方案成本降幅如何?
A:以800G光模块为例,BOM成本为600-700美金,DSP芯片价值约50-70美金。LPO技术虽然去掉了DSP,但TIA&DRIVER需要高线性度芯片,成本较之前可能增长3-5美金,系统总体成本预计下降在8%-9%。此外,成本并不是LPO最大的优势,最大的优势在于降功耗和降延迟。
Q:高线性度TIA&Driver的主要供应商有哪些?
A:代表性厂商有Macom、Semtech、美信,这三家是原来比较强的电芯片厂商,但在DSP上不如博通和Inphi,希望弯道超车。所以它们大力推LPO线性直驱的驱动和TIA芯片,不过博通也有跟进。
Q:剑桥可借助Macom的能力,所以在LPO光模块方面有一定优势吗?
A:封装和设计不是LPO技术的绝对门槛,区别主要在电芯片。根据公开资料,剑桥科技Macom在芯片供应上有战略合作关系,我们推测Macom的高线性度的TIA DRIVER技术会第一时间给到剑桥去开发LPO的线性直驱光模块。
Q:谷歌上量的800G是使用传统的DSP,大概多久LPO能真正上量?
A:目前只是技术发布,对应芯片还未规模化量产,Macom和Semtech还在送样,今年年底芯片量产,今年年底到明年年初模块量产。
至于上量到多大规模,多少客户会采购,取决于客户倾向。光模块领域规格非常多,包括SR100米、低压500米、FR两公里、LR10公里,2公里的需求量超50%,但LPO牺牲了DSP的很高信号恢复能力,主要还是用在低规格、短距离的连接场景,如海信发布的LPO技术需要用OM4光纤传输50m的连接,LPO技术很大程度上只能替换DAC/AOC短距离&几十米内的连接需求。
下游客户的倾向也有区别。谷歌一贯以来对新技术相对保守,硅光、线性直驱光模块都是以牺牲性能为代价换取成本优势,谷歌不太愿意尝试。微软和meta可能会愿意接受LPO这种方案,但他们的800G还没上量。今年800G的需求大概是50-70万只,但主要被谷歌采购,所以不确定明年LPO方案能否放很大量,估计从2024-2025年逐步上量。
比如Ⅱ-Ⅵ在400G时代就搞过LPO技术,但当时性能不太好。在800G时代一是整个芯片技术提升,高线性度的TIA/DRIVER、交换机以及DSP的数据恢复性能都提升,二是DSP成本和功耗更显著,所以LPO的性能和成本优势更明显体现了,大家接受度更高。
Q:目前各家公司的进度哪家更快更好?
A:目前头部公司都不错。剑桥和Macom有良好的合作,其他头部光模块大厂也都是从Macom、Semtech拿到Tia Driver,大家拿芯片的时间差异不大,目前处于同一起跑线。Meta和微软在对LPO产品做测试验证,谷歌目前还未接受该新产品,亚马逊还没启动测试,预计今年下半年会送样&测试。另外,设备商Arista非常推崇LPO技术,但海外设备商800G上量时间会比云厂商更晚。
Q:距离适用范围就只是服务器接到架顶交换机吗?
A:是的,目前只能实现50米之内的连接。比如,海信发布的LPO光模块命名为ODAC,对标不是2公里的光模块,而是和DAC去竞争,因为随着速率越来越高,铜缆可实现的连接距离会大大缩水,LPO技术相对于DAC铜缆技术可以进一步拓宽连接场景,调整系统功耗,有一定优势。但随着交换机的信号恢复能力提升,有希望拓展到架顶交换机和叶交换机的互连,这种互连基本需要百米级,如果LPO由50米以内拓展到百米级,会增加一些市场应用。
Q:占比最大的交换机之间互连的场景,还是以传统光模块为主?
A:对,100G时代的主流规格是PSM4和CWDM4,2公里的规格占40%左右的量。200G的主要采购规格是 FR4,400G由前期短距离DR4后转到2公里FR4,所以CWDM4、FR4是大型IDC的主要规格。2公里对应的实际连接距离是500米-2公里范围,即500米以上都用2公里规格。
Q:CPO主要替代DR4距离,LPO主要替代服务器到架顶交换机的距离,都是降低功耗和成本,未来哪个技术发展趋势会更快。
A:LPO是光模块的封装形式,是可插拔模块向下演进的技术路线,主要用来实现降功耗;CPO也是演进的路线,但不是在可插拔光模块架构下,而是将光模块移到靠近交换机芯片,做到交换机设备里面。LPO更容易实现、确定性更强,最早今年下半年,最晚明年就会在市场上有真正的需求。CPO是一项全新的技术,速率越高,它能实现的降功耗水平越高。当前光模块引入LPO技术可以降35%-50%的功耗,速率更高后,由于LPO离不开光模块的形式,在整个系统上降功耗水平有限,因为将来大量的功耗是在光模块到核心交换机芯片的连接距离上。CPO解决的就是这个链动距离上的功耗问题,跟LPO降光模块本身的功耗是两件事,CPO由于涉及大量全新技术,第一代产品至少也会在两年后出来,真正上量可能要到2026-2027年。
Q:头部几家光模块企业在LPO技术方面进展?
A:差不多,因为这项技术的核心不是光模块本身,而是芯片。有了芯片之后都能做,只是看愿不愿意做。
Q:Meta从测试验证到上量差不多要大半年?
A:是的。客户做可靠性测试至少要5000小时,80-90天,大概要3个月。大规模采购前还有小批量采购做系统兼容性测试,需要1.5-3个月。总的来说,规模化量产前需要大半年时间验证。
Q:Meta和微软没有采购指引只是在做测试?
A:今年对800G需求较强的是谷歌和英伟达,明年meta和亚马逊大概率会上量,但不确定量是多少,今年年底招投标时会更确定一些。