异动
登录注册
无名小韭48921112
这个人很懒,什么都没有留下
个人资料
  • 无名小韭48921112
    2024-12-29 18:33:01
    明白人
    @夜长梦山:Deepseek V3模型解读:算力不再关键了吗?
    12.26日晚,全新大模型Deepseek V3上线,拥有671B参数,训练数据14.8T 高质量token,训练成本极低,仅为557.6万美金,整个训练只需要280万个GPU小时,而LLama 3(405B)使用了3080万GPU小时,几乎是Deepseek V3的11倍,相比较来说Deepsee
    104 赞同-114 评论
    0
    0
    0
  • 1
前往
96
关注
0
粉丝
13.97
工分
沪ICP备20009443号
© 2020 上海韭研信息科技有限公司
关于韭研公社
问题反馈
有问题请联系@韭菜团子
公社愿景:韭研公社,原韭菜公社,投资干货最多的共享社群,汇聚全网最深度的基本面研究,消弭个人滞后机构的逻辑鸿沟。
风险提示:韭研公社里任何网友的发言,都有其特定立场,均不构成投资建议,请投资者独立审慎决策。