🔥商汤4月23日推出日日新SenseNova 5.0大模型体系,基于超过10TB tokens训练,综合能力“全面对标GPT-4 Turbo”
🎁长文本+多模态趋势确认,AI推理算力需求如火如荼
🔹【长文本】趋势确认,AI推理侧标配200K。日日新5.0推理时上下文窗口可以有效到 200K 左右,Kimi为20万字(约250K),Claude3为200K,GPT-4 Turbo为128K
🔹日日新5.0新增【多模态】交互能力,支持高清长图解析和理解以及文生图交互式生成
🎁参数量持续爆发,AI训练持续支撑算力芯片出货
🔸AI训练对算力芯片需求驱动力不减。此次5.0大模型达到6000亿参数,据澎湃新闻,训练一个千亿参数的模型大约需要10830个英伟达A100 GPU。若线性外推,以H100 GPU训练6000亿参数大模型,大约需要18940个H100 GPU
🔸持续看好国产算力芯片渗透。2023年报显示,商汤大模型基础设施大装置SenseCore总算力规模突破性增长至12000 petaFLOPS,运营GPU数量达4.5万卡,其中国产算力2000P,国产化率约17%
🎁AI大模型加速竞赛,AI训练侧算力需求层出不穷
🔹上周(4.18)Meta推出最强开源LLaMA-3大模型,基于15T个token,含8B和70B两个版本,另有400B+参数版本持续训练中
🔹此前(3.19)OpenAI CEO对外披露GPT-5性能改进幅度或超预期,一系列重要产品亟待发布
红包产业链相关公司:
- CPU/GPU:寒武纪 海光信息
- 服务器:工业富联
- PCB:沪电股份 胜宏科技
- 铜链接 沃尔核材 精达股份等