登录注册
幻方AI正式发布新一代开源模型
夜长梦山
2024-05-10 08:31:30
重发❗Kimi后看到的AI又一重大突破: 幻方AI正式发布新一代开源模型,模型成本骤降下重申看好AI应用商业闭环【天风计算机 缪欣君团队】 #幻方AI发布了开源的MOE模型DeepSeek-V2 幻方在5月6日发布了新一代大模型DeepSeek-V2,模型为总计236B参数的MOE模型,约21B激活,在训练阶段模型本身使用了8.1万亿tokens进行训练。模型在架构上持续创新,采用了创新的MLA架构(注意力机制中相较于传统的MHA,能够显著降低内存占用),叠加MOE结构中的创新,使得推理成本显著下降,目前模型已经开源 #模型效果优异但成本低到极致 在目前大模型主流榜单中,DeepSeek-V2均表现出色:中文综合能力(AlignBench)开源模型中最强;英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral 8x22B,模型支持128k上下文。在测评得分上,MMLU得分77.8分,整体超过GPT3.5接近GPT4,与最新的LLaMA3 70B接近。同时推理的价格非常低,输入100万tokens成本仅1元,输出2元,约等于GPT-4的百分之一,相较月之暗面24元的也大幅降低 #大模型成本有望下降带动应用增长 大模型在2024年逐步走向小型化、低成本化和接近GPT4水平,海外开源模型已经形成了四分天下的局面,国内也迎来了超低成本的大模型方案,成本是诸多应用的瓶颈之一,而幻方AI大模型的发布也有望大幅降幅大模型应用门槛 🔥推荐关注 1.应用:(1)办公软件:金山办公、福昕软件、彩讯股份 (2)多模态:万兴科技、美图公司、虹软科技、光云科技 (3)TO B:用友网络、金蝶国际、致远互联、泛微网络、鼎捷软件、汉得信息 (4)金融、教育、医疗:科大讯飞、佳发教育、视源股份、润达医疗、恒生电子、新致软件
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
金山办公
工分
19.95
转发
收藏
投诉
复制链接
分享到微信
有用 33
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(14)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    05-10 15:25
    谢谢分享
    2
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 15:18
    谢谢分享
    2
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 13:54
    感谢分享
    2
    1
    打赏
    回复
    投诉
  • 斯武
    中线波段的散户
    只看TA
    05-10 13:11
    谢谢分享
    2
    1
    打赏
    回复
    投诉
  • 耀华璟耀
    热爱评论的散户
    只看TA
    05-10 13:02
    感谢分享!
    2
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 12:53
    感谢分享
    2
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 23:39
    感谢
    1
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 21:50
    感谢分享
    1
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 18:00
    感谢分享
    1
    1
    打赏
    回复
    投诉
  • 只看TA
    05-10 11:37
    转发的吧、看了几遍了
    1
    1
    打赏
    回复
    投诉
  • 1
  • 2
前往