周五盘后已经可以确认腾讯将于下周一举行“行业大模型及只能应用技术峰会“,作为国内互联网TOP1,腾讯拥有顶级的流量入口和生态,必然不会错过这场AI的盛宴。
S世纪华通(sz002602)S S寒武纪(sh688256)S S腾讯控股(00700)S
1. 腾讯大模型的进展
1)首先在单模态NLP领域,其实水平已经还可以,至少不比国内的差,比如和科大讯飞、百度、阿里相应的模型进行基准测试,表现都可以持平或得分略高。但目前的基本测试主要是基于中文的单模态测试,学界也没有出来更严格意义上的新的评价机制,所以目前表现还可以。
其实国内都浪费了很多时间,现在几乎都在同样的时间节点进行追赶,所以如果数据质量没有本质的差距,应该区别不会特别大。但在多模态领域,可能百度看起来是要好一点,因为百度已经推出了多模态的服务,腾讯具体的推出时间还没把握。
2)在落地策略方面,会先推出2B模式给开发者,先把生态基础做好,鹅厂其实最怕的在生态位上掉队,在B端大模型的生态做成熟后再开放给C端。
其实toC如果开放给公众,能达到比较好的宣传效果,但腾讯一直比较稳健经营,属于不是特别赶进度的公司,经济上可能并不划算。所以先给开发者,先把生态基础做好,这个思路其实和华为比较相似。
3)腾讯做大模型的目标
在模型结构设计上,第一阶段目标是万亿参数,第一步迈的比较大。但万亿参数的模型训练需要非常巨大的数据,数据量的准备最终对模型结果的影响都是非常大。参数上国内玩家入口肯定会从大参数入手,比较担心因为神经元不够而导致能力不够,从研发的角度一定是想高参数发展,未来在高参数模型表现较好的情况下,会考虑通过模型蒸馏的方式做一些相对小的模型。
其次是目前不具备GPT4多语言多模态的能力,混元大模型可能只是在某些分支上表现的还可以。
如果看和OPENAI的差距,认为主要差距主要是数据准备上,起步晚,中文本身数据质量不如英文,但混元模型的技术特点在国内的竞争中是不落后的,因为在数据仓库、数据的整理和分层、参数量、包含算力都在国内第一梯队。
4)相关人员配置:
聚全公司之力做,没有大型的赛马机制,但是在研发的过程中可能有不同的小组,分别负责不同的方向分支,后续看哪个方向分支能走得出来。整体上模型研发人员50人左右,模型基建300人左右(太极平台)。
5)国内玩家和Open Al在算力和算法能力上的差距
Open Al在硬件军备竞赛中彻底领先,微软Azure至少有十万级满载GPU的设备为其服务做加特,一台设备成本在2-3w美金,估计下来100亿美金成本左右,根据会计做下滩销,符合媒体每年20-30亿美金的成本估计。其次底层系统和算法计算层,微软和Google会领先,但是这种是云计算领域,目前方向比较明确的领先部分可弥补。
2. 腾讯大模型投资线条挖掘
1)算力
腾讯与海外大厂差距最大的地方无疑在数据和算力,我个人是认为代码能力腾讯不弱,这周我在公号分享了最近所有英伟达产业链(AI服务器、光模块、PCB等)龙头公司的指引,从他们的口径上看,腾讯买的N卡数量非常有限。
我是认为现阶段没有必要贬低国产算力了,大模型目前仅仅在初级阶段,未来仍旧会有数不清的训练,更何况推理。只要蛋糕在,国内厂商一定会想办法突破,不去期待什么超越英伟达,至少在缩小差距的维度,是可以展望的,要明白,AI的行情发展到现在,市值上隐含弹性最大,业绩上隐含弹性最大的,都是国内AI芯片。未来腾讯在C端要落地大模型,每年的资本开支至少需要上百亿,如果没有国内的供应商,BBAT靠什么去支撑大模型的生态。
腾讯与寒武纪等国内大厂都有展开合作(测试阶段居多),国产算力卡的算力和能耗参数其实还好,主要还是生态的问题比较大。本质是代码层面的问题,这一点通过努力优化,差距正在缩小。
从目前了解到的情况来看,腾讯在国产算力供应商方面的开拓,比许多人预期的快不少。
2)应用侧
腾讯的生态自不用说,流量入口和乘数都是国内顶级。
最近一直在说TMT这一轮是流动性因子驱动的牛市,所以别太较真,泡沫最大的风险是踏空。
而腾讯的入口生态包括众多领域,找每个领域“含鹅量“高、最好还没法按计算器的公司。
世纪华通:第二大股东就是鹅厂,公司投资的腾讯长三角人工智能超算中心(腾讯云订单,长三角规模最大IDC)及深圳5G大数据中心(华为云订单,深圳规模最大IDC),分别部署40000个和12000个机柜。通过与利通电子成立项目公司,首期1000张H800(鹅),算力4000P,规划5000张,总算力20000P。
这里着重说一下,前几天我提到一个思路,算力中心本质也是新基建,一颗芯片从卖出去到上云再到B端,对GDP的拉动乘数要远大于消费和汽车,接下来其实值得期待众多配套的刺激ZC,目前还仅仅在交易上海算力中心(云赛智联等)和南部算力节点(弘信电子),后续发散的空间不小,各个省会城市也许都会有。
东华软件:之前已经发过公告,与腾讯云计算签署深化战略合作协议,下周一发布会多半会现身,主要应用层面在医疗、金融领域,东华无疑是腾讯B端生态的重要合作伙伴。
其他还有很多公司,我直接按含鹅量(腾讯参股)+生态进行排序,注意,这个排序和看好与否没有任何关联性,单纯为了方便看,具体谁好,要根据该领域AIGC的实际进展进行决策(其中部分或许有出入,欢迎修改补充):
博思软件: 14.97%,金融
泛微网络: 4.89%,企业服务软件
天融信:1.94%,网安
长亮科技:1.14%,银行IT
常山北明:0.54%,智慧城市
华宇软件:智慧法务