异动
关注
社群
搜公告
产业库
时间轴
公社AI
通知
全部已读
暂无数据
私信
暂无数据
登录注册
我的主页
退出
无名小韭48921112
这个人很懒,什么都没有留下
个人资料
无名小韭48921112
2024-12-29 18:33:01
明白人
@夜长梦山:Deepseek V3模型解读:算力不再关键了吗?
12.26日晚,全新大模型Deepseek V3上线,拥有671B参数,训练数据14.8T 高质量token,训练成本极低,仅为557.6万美金,整个训练只需要280万个GPU小时,而LLama 3(405B)使用了3080万GPU小时,几乎是Deepseek V3的11倍,相比较来说Deepsee
104 赞同-114 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭48921112
2024-12-29 18:33:01
明白人
@夜长梦山:Deepseek V3模型解读:算力不再关键了吗?
12.26日晚,全新大模型Deepseek V3上线,拥有671B参数,训练数据14.8T 高质量token,训练成本极低,仅为557.6万美金,整个训练只需要280万个GPU小时,而LLama 3(405B)使用了3080万GPU小时,几乎是Deepseek V3的11倍,相比较来说Deepsee
104 赞同-114 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭48921112
2024-12-29 18:33:01
明白人
@夜长梦山:Deepseek V3模型解读:算力不再关键了吗?
12.26日晚,全新大模型Deepseek V3上线,拥有671B参数,训练数据14.8T 高质量token,训练成本极低,仅为557.6万美金,整个训练只需要280万个GPU小时,而LLama 3(405B)使用了3080万GPU小时,几乎是Deepseek V3的11倍,相比较来说Deepsee
104 赞同-114 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭48921112
2024-12-29 18:33:01
明白人
@夜长梦山:Deepseek V3模型解读:算力不再关键了吗?
12.26日晚,全新大模型Deepseek V3上线,拥有671B参数,训练数据14.8T 高质量token,训练成本极低,仅为557.6万美金,整个训练只需要280万个GPU小时,而LLama 3(405B)使用了3080万GPU小时,几乎是Deepseek V3的11倍,相比较来说Deepsee
104 赞同-114 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭48921112
2024-12-29 18:33:01
明白人
@夜长梦山:Deepseek V3模型解读:算力不再关键了吗?
12.26日晚,全新大模型Deepseek V3上线,拥有671B参数,训练数据14.8T 高质量token,训练成本极低,仅为557.6万美金,整个训练只需要280万个GPU小时,而LLama 3(405B)使用了3080万GPU小时,几乎是Deepseek V3的11倍,相比较来说Deepsee
104 赞同-114 评论
0
0
0
上一页
1
下一页
前往
页
96
关注
0
粉丝
13.97
工分
社区规则
服务协议
隐私政策
沪ICP备20009443号
© 2020 上海韭研信息科技有限公司
关于韭研公社
问题反馈
有问题请联系
@韭菜团子
公社愿景:韭研公社,原韭菜公社,投资干货最多的共享社群,汇聚全网最深度的基本面研究,消弭个人滞后机构的逻辑鸿沟。
风险提示:韭研公社里任何网友的发言,都有其特定立场,均不构成投资建议,请投资者独立审慎决策。
2
3