感谢-韭研公社

异动

关注

社群

搜公告

产业库

时间轴

公社AI

登录注册

無名之輩

2025-01-26 16:23:31

感谢

@戈壁淘金： 1、DeepSeek属于大语言模型，而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少，主要是通过激活参数少、把精度降低实现的(16位变8位)，这是在不断改进基础大模型，而r1是在v3这个基础模型上，又花了大量算力去让他推理能力更强。而豆包属于基于

119 赞同-55 评论

声明：文章观点来自网友，仅为作者个人研究意见，不代表韭研公社观点及立场，站内所有文章均不构成投资建议，请投资者注意风险，独立审慎决策。

工分