4月10日,昆仑万维发布两大消息,一是即将推出对标ChatGPT的双千亿级大语言模型——“天工”3.5,
昆仑万维宣布将推出对标ChatGPT的“天工”3.5
4月10日,昆仑万维公告了“天工”3.5发布在即,并将于4月17日启动邀请测试的消息。而在其官方微信上,该公司更进一步将“天工”3.5定义为“中国第一个真正实现智能涌现的国产大语言模型”。
昆仑万维称,可以推断,友商模型的逻辑推理是靠定向优化来覆盖特定题库,而不是靠大模型的智能涌现来解答较为复杂的问题。而靠人工打补丁、定向优化的方式是不能真正实现人工智能的。“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,所以把这个版本命名为“天工”3.5,未来“天工”4和“天工”5也将继续以行业领先的速度与大家见面。
有意思的是在公告中,昆仑万维则指出公司开发中的“天工”3.5目前仍在测试阶段,后续仍面临技术研发进展不及预期、应用实践不及预期、商业化落地不确定及行业政策变化等风险。
众所周知,训练通用大模型非常“烧钱”。据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。以ChatGPT在1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。