英伟达A40显卡禁售, GPU云桌面路在何方?英伟达A40显卡一夜之间禁售,随之而来的将是以英伟达A40显卡为基础的显卡虚拟化GPU云桌面方案无法交付,国内GPU云桌面路在何方?
近日,美国商务部工业与安全局 (BIS) 发布的芯片和半导体设备出口限制新规(简称芯片出口限令)导致英伟达A40、A30、L40、L40S、RTX 4090、L4、A6000、A100、H100、A800、H800对华禁售。而目前正常在售的英伟达显卡只有RTX A5000、RTX A4000、RTX A2000、RTX 6000、RTX 5000、RTX 4000、RTX 4080、RTX 4070以及RTX 30系列。
禁售令一出,使用A40显卡虚拟化方案的国内云桌面厂商GPU云桌面产品将难以为继,不得不寻找替代方案。
GPU云桌面是虚拟桌面基础架构的典型技术应用。它不是给每个用户都配置一台独立的GPU工作站,而是将数据中心的服务器进行桌面虚拟化,用户通过客户端设备连接虚拟桌面进行工作,主要应用于机械制造、能源交通、建筑设计、电子设计等行业,如机械自动化设计、EDA设计、汽车零配件设计、重型机械设计、BIM设计等。
GPU云桌面的核心就是显卡方案,超过60%云桌面厂商都选择英伟达显卡虚拟化作为其GPU云桌面显卡方案,A40由于其显存达48GB,可灵活分为多个虚拟显卡,因此被众多厂商选用为显卡虚拟化方案标准配置。由此可见,英伟达A40显卡禁售对国内GPU云桌面市场影响之大。
目前各云桌面厂商GPU方案有以下四种不同技术路线:(1)软件模拟显卡(2)显卡直通(3)显卡虚拟化(4)显卡物理共享
我们再看看不同技术路线在CAD设计场景下的表现。
(1)软件模拟显卡
由于显卡模拟器是通过软件来模拟显卡的工作过程,其性能和效果受到了限制,无法真正调用显卡资源处理CAD模型设计任务,甚至连零部件级别的小模型也无法正常操作。
(2)显卡直通
受制于服务器空间限制,单张显卡的尺寸和性能有瓶颈,当CAD装配体不断增大时,会出现操作卡顿、鼠标反应延迟、重影等一系列普通工作站面临的重载GPU难题。
(3)显卡虚拟化
显卡经虚拟化后分为多个相互隔离的虚拟显卡,每个虚拟显卡的计算能力和显存都是整个显卡的1/n。在CAD设计场景中,每个虚拟显卡平均利用率都维持在较低水平,而整个显卡使用率并不高。当CAD模型规模较大、所需显存超过虚拟显卡分配显存后,将会导致操作卡顿,甚至引起桌面崩溃、死机。
(4)显卡物理共享
显卡物理共享模式下,多个桌面对显卡资源的调用经操作系统调度,显卡利用率是相互叠加的,可以简单理解为多个脉冲式调用错峰叠加,最终表现在显卡运行在较高的利用率水平,极大的提高了显卡使用效率,从而使得利用性价比较高的专业图形显卡解决GPU云桌面问题成为了可能。
据了解目前国产云桌面厂商主要玩家有:深信服、华为、并行科技、龙思云、新华三、锐捷、泽塔等。
其中并行科技、龙思云作为显卡物理共享技术的典型代表,占据越来越多GPU云桌面市场,“显卡物理共享+云桌面”是目前国内唯一可以覆盖轻度GPU和重载GPU应用场景的解决方案。以并行科技设计仿真云产品为例,其充分发挥了显卡物理共享技术的优势,采用专业图形显卡,如NVIDIA RTX 5000、NVIDIA RTX A2000等,既解决了GPU云桌面的使用问题,又不用担心因英伟达A40显卡禁售导致的交付问题。
最后让我们期待一众国产云桌面厂商可以发挥所长,实现国产GPU云桌面快速崛起。
支持国产化,从你我开始!