异动
关注
社群
搜公告
产业库
时间轴
公社AI
通知
全部已读
暂无数据
私信
暂无数据
登录注册
我的主页
退出
無名之輩
2025-01-26 16:23:31
感谢
@戈壁淘金:
1、DeepSeek属于大语言模型,而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少,主要是通过激活参数少、把精度降低实现的(16位变8位),这是在不断改进基础大模型,而r1是在v3这个基础模型上,又花了大量算力去让他推理能力更强。而豆包属于基于
113 赞同-54 评论
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
0.00
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
清空
确定
清空
确定
导入文档
同时转发
发布
暂无数据
确定要分配的奖金