异动
登录注册
雨夜肥韭菜
2025-01-26 22:26:18
感谢分享
@A股总财: 事件:DeepSeek v3震撼发布,仅用十分之一计算量就达到比肩 Llama 3 405B 的性能!仅用550万元2000张卡做的,和OpenAI几亿烧出来的一样好,这让美国人彻底坐不住了。其秘诀在于三大架构创新:多头潜注意力 (MLA) 大幅降低长文本推理成本,混合专家模型 (MoE) 创新解决
5 赞同-4 评论
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
0.01
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据