彭博社又来报道!IOS18即将为SIri 灌注新的灵魂
面对硬件的更严厉封锁,我们这边应运而生的DEEPSEEK的引力值得关注!
周五只是朦胧的启动了几个标的。身位差不是坏事。
看看一些卖方机构的分析:
首先来自 新财富计算机AI之王 国盛证券 刘高畅
DeepSeek-V2 API 的定价为:每百万 tokens 输入 1 元、输出 2 元(32K 上下文), 价格仅为 GPT-4-Turbo 的近百分之一。DeepSeek-V2 成本低的原因是没有沿用主流的 “类 LLaMA 的 Dense 结构”和“类 Mistral 的 Sparse 结构”,而是对模型框架进行了全 方位的创新,提出了 MLA(Multi-head Latent Attention)架构,大幅减少计算量和推理 显存;自研 Sparse 结构 DeepSeekMoE 进一步将计算量降低到极致,两者结合最终实现 模型性能跨级别的提升。据幻方官方不严谨估计,DeepSeek-V2 以 236B 总参数、21B 激活,大致达到 70B~110B Dense 的模型能力,同时消耗的显存只有同级别 Dense 模型 的 1/5~1/100,每 token 成本大幅降低。再来看申万
华福:
我们认为,大模型成本优化与算力需求并不是直接的此长彼消,而是
互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地,进而
会衍生出更多的微调及推理等需求,将逐步盘活国内 AI 应用及国产算力
发展。
总结
意义1:在目前我国算力硬件被卡脖子的特殊时刻,能从软件改进算法的角度去环节卡脖子的事情,官方一定会大力宣传!
意义2:联合国5月8日电要坚持真正的多边主义,保障所有国家特别是发展中国家全面平等参与人工智能全球治理,增强发展中国家在人工智能全球治理中的代表性和话语权。
标的 1)AIGC:金山办公、万兴科技(出海)、虹软科技(手机大模型+出海)、新致软件、
星环科技、中科创达、润达医疗(医药)、福昕软件、萤石网络、汉得信息。
标的 2)数字经济领军:金山办公、恒生电子、中控技术、德赛西威、安防行业、启明星
辰、科大讯飞、华大九天、同花顺、金蝶国际。
标的 3)信创&数据:软通动力、索辰科技、能科科技、纳思达、太极股份、税友股份。
标的 4)AIGC 算力:浪潮信息、海光信息、神州数码、中科曙光等。