异动
关注
社群
搜公告
产业库
时间轴
公社AI
通知
全部已读
暂无数据
私信
暂无数据
登录注册
我的主页
退出
无名小韭20180207
这个人很懒,什么都没有留下
个人资料
无名小韭20180207
2025-02-07 09:50:28
非常不错
@耕牛遍地走:DeepSeek潜在的方向:飞利信
无论是春节火爆出圈的DeepSeek,还是新热点“蒸馏法”,都脱离不开MLA技术,MLA 也就是指多头潜在注意力机制(Multihead Latent Attention mechanism),通过引入潜在变量,将高维输入信息压缩至低维潜在空间,以更高效地捕捉数据中的关键信息和依赖关系一、MLA 技
3 赞同-2 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭20180207
2025-02-07 09:50:28
非常不错
@耕牛遍地走:DeepSeek潜在的方向:飞利信
无论是春节火爆出圈的DeepSeek,还是新热点“蒸馏法”,都脱离不开MLA技术,MLA 也就是指多头潜在注意力机制(Multihead Latent Attention mechanism),通过引入潜在变量,将高维输入信息压缩至低维潜在空间,以更高效地捕捉数据中的关键信息和依赖关系一、MLA 技
3 赞同-2 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭20180207
2025-02-07 09:50:28
非常不错
@耕牛遍地走:DeepSeek潜在的方向:飞利信
无论是春节火爆出圈的DeepSeek,还是新热点“蒸馏法”,都脱离不开MLA技术,MLA 也就是指多头潜在注意力机制(Multihead Latent Attention mechanism),通过引入潜在变量,将高维输入信息压缩至低维潜在空间,以更高效地捕捉数据中的关键信息和依赖关系一、MLA 技
3 赞同-2 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭20180207
2025-02-07 09:50:28
非常不错
@耕牛遍地走:DeepSeek潜在的方向:飞利信
无论是春节火爆出圈的DeepSeek,还是新热点“蒸馏法”,都脱离不开MLA技术,MLA 也就是指多头潜在注意力机制(Multihead Latent Attention mechanism),通过引入潜在变量,将高维输入信息压缩至低维潜在空间,以更高效地捕捉数据中的关键信息和依赖关系一、MLA 技
3 赞同-2 评论
0
0
0
上一页
1
下一页
前往
页
无名小韭20180207
2025-02-07 09:50:28
非常不错
@耕牛遍地走:DeepSeek潜在的方向:飞利信
无论是春节火爆出圈的DeepSeek,还是新热点“蒸馏法”,都脱离不开MLA技术,MLA 也就是指多头潜在注意力机制(Multihead Latent Attention mechanism),通过引入潜在变量,将高维输入信息压缩至低维潜在空间,以更高效地捕捉数据中的关键信息和依赖关系一、MLA 技
3 赞同-2 评论
0
0
0
上一页
1
下一页
前往
页
7
关注
0
粉丝
0.08
工分
社区规则
服务协议
隐私政策
沪ICP备20009443号
© 2020 上海韭研信息科技有限公司
关于韭研公社
问题反馈
有问题请联系
@韭菜团子
公社愿景:韭研公社,原韭菜公社,投资干货最多的共享社群,汇聚全网最深度的基本面研究,消弭个人滞后机构的逻辑鸿沟。
风险提示:韭研公社里任何网友的发言,都有其特定立场,均不构成投资建议,请投资者独立审慎决策。
2
3