登录注册
特斯拉DOJO+英伟达GPU+谷歌TPU+昇腾:趋势是带宽与扩展性!
水复花明
只买龙头的游资
2023-09-19 17:33:43
【申万】智联汽车深度三十三暨华为系列深度之六:

特斯拉DOJO+英伟达GPU+谷歌TPU+昇腾:趋势是带宽与扩展性!


  本期投资提示:

  特斯拉Dojo 芯片、华为服务器/AI 能力都是近期产业重要事件。本篇报告分析特斯拉Dojo/英伟达 GPU/谷歌TPU/华为昇腾等的异同,并做AI 产业计算和通信趋势的预测。

  Dojo 芯片与架构的特色至少包括存算一体/扩展性强/路由便捷/带宽高。在IEEE MICRO2020 上, 特斯拉发布FSD《Compute Solution for Tesla ’ s Full Self-DrivingComputer》。在2022 年8 月hotchips 34 大会上,特斯拉发布《The Microarchitectureof Dojo, Tesla’s Exa-Scale Computer》和《Dojo Super-Compute System Scaling forML Training》。Dojo 至少有存算一体/扩展性强/路由便捷/带宽高四个特色。

  英伟达GPU/谷歌TPU/昇腾AI/Tesla DSA,从架构解释异同。1)2010 年以来,英伟达GPU 主要架构至少包括八类,具备衍生关系。趋势:注重互联/注重带宽和扩展性/对AI 支持与时俱进(从Cuda Core 到Tensor Core,增加对INT/BF16 等AI 新趋势的支持,结构稀疏矩阵支持)。2)根据TPU 五代架构,趋势:注重互联/注重扩展性/对AI 支持与时俱进(如用脉动阵列的方法支持矩阵乘法)。3)根据华为官网和《机器之心》等,华为昇腾(达芬奇架构)应与谷歌TPU 有类似之处。4)共同点是扩展性/AI 甚至大模型下特殊操作,区别是Dojo 有特殊性(不同处理器设计是“架构向后兼容”,不需要颠覆架构)。

  计算部分的未来趋势:1)与时俱进,适应AI 数据精度/场景特殊运算。2)带宽最大化,延展性关键化。3)核心数可能减少。正文有详细论述。

  通信部分:DIP 和TTPoE 是Dojo 的网络核心。Dojo 系统的构架过程,以node 核心为最小单元,每1 个D1 包含354 个nodes、每1 个Tile 包含25 个D1、每1 个Tray 包含6 个Tiles,每个机柜包含2 组Tray。Dojo Interface Processor(DIP)用于HBM内存扩容、PCIe 扩展、以及对外的网络连接。Tesla Transport Protocol 可以对应于CXL、NVLink 等,基于以太网提供400Gb/s 的核心网络带宽。

  通信部分的未来趋势:Dojo 试图打破冯诺依曼约束,借助软件与网络,平衡系统中的时延、带宽、资源消耗量和传输距离。我们推算Dojo 的网络设备与器件使用情况,基础BasePOD 177 个机柜的规模下,假设fat-tree 的2 层交换架构组网且全部使用光通信系统,总共需要14160×2=28320 个光模块,对应177 个机柜中的53100 个D1 芯片,另外Host 系统预计也需要若干光模块。若Dojo 系统与Nvidia A100 系统对标,显著差异是网络带宽从200Gb 网络升级至400Gb、SRAM与DRAM容量与带宽提升、引入15kw的液冷封装方案,最终整体算力性能显著提升。

  流量环节:关注中际旭创、华工科技、新易盛、天孚通信、中兴通讯、紫光股份、锐捷网络等;

计算环节:关注浪潮信息、胜宏科技(电子)、神州数码(tmt)等;

华为产业链:关注华大九天(tmt,EDA)、软通动力(大模型+OS+数据库)、长电科技(电子,封测)、润达医疗 (医疗AI)、赛意信息(MetaERP) 、中软国际、广电运通、神州数码等;

特斯拉和智能车产业链:关注德赛西威、立讯精密(电子)、双环传动(机械&汽车)等。


  风险:关注由于复工/宏观环境等扰动,2022-2023 年内存在业绩波动风险。GPU/DSA、智联汽车、机器人领域一向的风险依然是研究竞争、产业链地位与管理。若难以相对准确地把握,可能会选中了次好的公司,对投资产生不良的结果。
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
赛力斯
S
金帝股份
S
张江高科
S
华映科技
S
电科芯片
工分
2.07
转发
收藏
投诉
复制链接
分享到微信
有用 3
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据