一、国内科技巨头在大模型领域已有多年布局
我们认为,以GPT大模型为代表的AI能力提升,开启了新一轮的科技创新周期,其中大模型成为科技创新的底座。
大模型增强AI技术的通用性,让开发者以更低成本、更低门槛,面向场景研发更好的AI模型,助力普惠AI的实现。基础大模型的大规模产业应用不仅需要有与场景深度融合的大模型体系,也需要有支持全流程应用落地的专业工具和平台,还需要开放的生态来激发创新;三层之间交互赋能,形成良性循环的产业智能化生态共同体。
在大模型领域,以百度、腾讯、阿里、华为为代表的国内科技巨头均已布局多年。其中百度早在2019年3月发布预训练模型ERNIE 1.0,2023年3月推出了文心一言(ERNIE Bot)。2021年4月,华为发布盘古大模型。2022年4月,腾讯对外披露混元大模型。2022年9月,阿里发布通义大模型系列。
二、我国主要大模型盘点
(1)百度文心大模型
百度率先在2019年3月发布预训练模型ERNIE 1.0,持续投入大模型的技术创新与产业应用,布局了NLP、CV、跨模态等大模型,率先提出行业大模型,构建大模型工具与平台,探索产品与社区,在企业端和用户端均有不同程度的突破。
(2)阿里通义大模型
2022年9月2日,阿里巴巴资深副总裁、达摩院副院长周靖人发布阿里巴巴最新「通义」大模型系列,其打造了国内首个 AI 统一底座,并构建了通用与专业模型协同的层次化人工智能体系,将为 AI 从感知智能迈向知识驱动的认知智能提供先进基础设施。
(3)腾讯混元大模型
2022年4月,腾讯对外正式宣布,腾讯“混元”AI大模型在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模态视频检索数据集榜单中先后取得第一名的成绩,实现了该领域的大满贯。
(4)华为盘古大模型
华为云盘古大模型于2021年4月正式发布,到2022年聚焦行业应用落地,已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。
我们认为,各大巨头目前在大模型技术上基本同源,且都具有资金、算力、人才、数据等发展条件,未来有望成为我国大模型的第一梯队。各家在应用场景上各有所长:百度具有搜索、小度智能音箱等应用场景;腾讯具有微信、QQ、游戏等应用场景;阿里具有电商、钉钉等应用场景;华为在2B应用方面独具优势。未来各家将结合自身优势,发力大模型研发及应用落地,我国的大模型产业将迎来快速发展阶段。
三、投资建议
百度大模型相关受益标的:汉得信息、东软集团、宇信科技、致远互联、软通动力、银之杰、风语筑、掌阅科技、蓝色光标等。
阿里大模型相关受益标的:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息等。
腾讯大模型相关受益标的:博思软件、世纪华通、掌趣科技、常山北明、四维图新、泛微网络、长亮科技等。
华为大模型相关受益标的:拓维信息、特发信息、润和软件、神州数码、宝兰德、创意信息、科蓝软件、软通动力、赛意信息等。
投资建议
重申坚定看好云计算SaaS、能源IT、金融科技、智能驾驶、人工智能等景气赛道中具备卡位优势的龙头公司,积极推荐以下七条投资主线:1、信创:国产数据库领军太极股份,国产WPS龙头厂商金山办公(与中小盘组联合覆盖),国产服务器龙头中科曙光,“中国芯”海光信息。其他受益标的还包括:1)信创软件:中国软件、用友网络、星环科技、海量数据、麒麟信安等。2)信创硬件:中国长城、龙芯中科、拓维信息、神州数码等。2、新能源IT:重点推荐新能源SaaS龙头国能日新、配网调度先头兵东方电子、能源互联网唯一标的朗新科技(通信组联合覆盖)。3、金融科技:重点推荐证券IT恒生电子,此外宇信科技、长亮科技、同花顺均迎景气上行。4、智能驾驶:重点推荐智能座舱龙头德赛西威(汽车组联合覆盖)、座舱+驾驶OS龙头中科创达、此外高精度地图领军四维图新为重点受益标的。5、人工智能:重点推荐智能语音龙头科大讯飞。6、网络安全:重点推荐商密+自研芯片三未信安,新兴安全双龙头奇安信+深信服,安恒信息作为细分新兴安全龙头也将深度受益,其他受益标的包括:启明星辰、美亚柏科等。7、云计算SaaS:重点推荐企业级SaaS龙头用友网络、办公软件龙头金山办公(与中小盘联合覆盖)、超融合领军深信服。
风险提示
市场系统性风险、科技创新政策落地不及预期、中美博弈突发事件。
盈利预测与估值
资料来源:wind、华西证券研究所
注:朗新科技(与通信联合覆盖)、金山办公(中小盘组联合覆盖)、指南针(非银组联合覆盖)。
2.本周热点内容
2.1.国内科技巨头在大模型领域已有多年布局
我们认为,以GPT大模型为代表的AI能力提升,开启了新一轮的科技创新周期,其中大模型成为科技创新的底座。
大模型增强AI技术的通用性,让开发者以更低成本、更低门槛,面向场景研发更好的AI模型,助力普惠AI的实现。基础大模型的大规模产业应用不仅需要有与场景深度融合的大模型体系,也需要有支持全流程应用落地的专业工具和平台,还需要开放的生态来激发创新;三层之间交互赋能,形成良性循环的产业智能化生态共同体。
模型层是大模型能力的核心引擎。模型层从技术发展与产业应用出发,主要包含基础、任务、行业大模型,模型的训练要求高,算力消耗大,建设人员主要为高级算法人员。基础大模型主要优势在于其通用性,可以让该技术方向的相关应用任务都得到进一步提升,但也正是这样的优势导致基础大模型在行业、任务中表现尚未最优。任务大模型是在基础大模型上,面向典型的任务,如对话、搜索、文档智能、人脸识别、OCR等,进一步结合任务特性,优化模型算法,学习任务相关数据与知识,从而使得大模型在任务上表现出更优异的效果,很多任务甚至可以零样本直接应用。行业大模型是在基础或任务大模型上,进一步融合行业数据、知识以及专家经验,提升大模型对行业应用的适配性,目前在金融、能源、制造、传媒、城市等已经有头部企业或机构与科技公司或科研单位联合发布了行业大模型。基础+任务+行业三层大模型相互促进,共同支撑起产业转化。
在大模型领域,以百度、腾讯、阿里、华为为代表的国内科技巨头均有布局。其中百度早在2019年3月发布预训练模型ERNIE 1.0,2023年3月推出了文心一言(ERNIE Bot)。2021年4月,华为发布盘古大模型。2022年4月,腾讯对外披露混元大模型。2022年9月,阿里发布 通义大模型系列。
2.2.我国主要大模型产品盘点
2.2.1.百度文心大模型
百度率先在2019年3月发布预训练模型ERNIE1.0,持续投入大模型的技术创新与产业应用,布局了NLP、CV、跨模态等大模型,率先提出行业大模型,构建大模型工具与平台,探索产品与社区,在企业端和用户端均有不同程度的突破。
百度凭借海量的知识积淀和丰富的应用场景推出的文心大模型,具备知识增强、产业级两大特色。百度自研的多源异构知识图谱,拥有超过5500亿条知识,被融入到文心大模型的预训练中。百度文心大模型同时从海量数据和大规模知识中融合学习,在知识的指导下,以语义单元为单位进行学习,效率更高、效果更好,可解释性更强。文心大模型已应用于百度搜索、信息流、智能驾驶、百度地图、小度等重要产品,服务数亿用户;在行业落地中,文心率先提出行业大模型概念,通过百度智能云在制造、能源、金融、城市、传媒等行业广泛应用;通过大模型工具平台、开源开放的模型与服务,已有近百万开发者使用文心大模型。
在近年的大模型技术探索与产业实践中,百度文心形成了支撑大模型产业落地的关键路径,构建文心大模型层、工具平台层、产品与社区三层体系:建设更适配场景需求的基础、任务、行业三层大模型体系,提供全流程支持应用落地的工具和方法,孵化基于大模型的任务系统与创新产品,营造激发创新的开放生态。
文心「基础+任务+行业」三级模型体系:文心大模型层,结合技术发展趋势、产业实践,构建基础、任务、行业三级模型体系。基础大模型聚焦技术方向的技术挑战、通用性、泛化性探索;任务大模型深入理解任务特性,构建预训练算法、训练数据集,打造紧贴任务的模型能力;行业大模型深度融合行业数据与知识特性,构建更适配行业的模型底座。基础大模型支撑任务与行业大模型的建设,任务和行业大模型结合真实场景与数据反哺基础大模型优化。
我们认为,百度在AI及大模型领域深耕多年,不仅具备完备的技术积累,同时发力技术与行业的结合,推出了行业大模型,并在多个应用场景中得到实际应用,具备先发优势。
目前,文心大模型已经建设了36个大模型,其中基础大模型包含:NLP(自然语言处理)大模型、CV(计算机视觉)大模型、跨模态大模型,任务大模型包含对话、搜索、信息抽取、生物计算等多个典型任务,行业大模型包含与来自8个行业的头部企业或机构共建的11个行业大模型。
(1)基础大模型:文心基础大模型覆盖了NLP、CV、跨模态三大方向
文心NLP大模型:百度发布了文心ERNIE系列NLP大模型,ERNIE3.0基于知识增强的多范式统一预训练框架,深入融合的千亿级知识,具备强大的语言理解能力与小说、摘要、文案创意、歌词、诗歌等文学创作能力。文心CV大模型:百度文心发布了VIMER系列的CV大模型,视觉自监督预训练大模型VIMER-CAE创新性地提出 “在隐含的编码表征空间完成掩码预测任务”的预训练框架,在图像分类、目标检测、语义分割等经典下游任务上刷新SOTA结果。文心跨模态大模型:文心跨模态大模型包括:ERNIE-ViLG2.0文生图大模型、ERNIE-ViL视觉-语言大模型、ERNIE-Layout文档智能大模型等。ERNIE-ViLG2.0是知识增强的 AI 作画大模型,在公开权威评测集MS-COCO上取得了当前该领域的领先效果,在语义可控性、图像清晰度、中国文化理解等方面均展现出了显著优势。
(2)任务大模型
百度文心面向典型任务推出对话大模型PLATO、搜索大模型ERNIE-Search、信息抽取大模型ERNIE-UIE、代码生成大模型RENIE-Code、生物计算大模型等。对话大模型PLATO是基于隐变量的生成式开放域对话大模型,具备接近真人水平的多轮流畅对话能力,开放域对话效果达到世界领先水平。信息抽取ERNIE-UIE是专门基于 ERNIE 通用模型在开放域信息抽取领域进行优化的模型,利用单一模型支持多种类型的开放抽取任务,用户可以使用自然语言自定义抽取目标,无需训练即可抽取输入文本中的对应信息。ERNIE-Code基于海量代码和文本数据进行预训练,引入联合学习,具备跨多种自然语言和编程语言的语义理解和生成能力,已经在代码翻译、代码提取任务上取得不错的效果。文心生物计算大模型构建面向化合物分子、蛋白分子的生物计算领域预训练模型,赋能生物医药行业。
(3)行业大模型
行业大模型是百度推进文心大模型深入产业落地的一项重要举措,是百度与行业头部企业、机构联合研发的融合行业数据、知识以及专家经验的大模型。目前百度文心在能源、金融、航天、制造、传媒、城市、社科以及影视等领域与国网、浦发、吉利、TCL、哈尔滨、上海辞书出版社等均有案例应用的行业大模型。这些行业大模型作为重要AI底座,在各行业的技术效果突破、产品创新、生产流程变革、降本增效等维度产生价值。
例如,百度与国网合作的NLP大模型,共同打造行业级人工智能基础设施,探索研发电力人工智能联合大模型,不仅提升了传统电力专用模型的精度,而且大幅降低了研发门槛,实现了算力、数据、技术等资源的统筹优化。百度与RM网的合作的NLP大模型,引入舆情数据中心积淀的行业知识来更好训练知识增强的传媒行业大模型,实现更少的标注数据下大幅提升传媒行业自然语言处理任务效果,如新闻内容审核分类、行情分析、摘要生成等行业任务相对于通用模型提升显著。百度与TCL合作的CV大模型,面向多个产线多个环节的工业质检提供AI基座能力,在TCL几个产线检测mAP指标平均提升10%+,训练样本减少到原有训练样本30%~40%,产线指标即可达到原有产线效果,新产线冷启动效率可提升3倍,产线上线开发周期降低30%。
百度大模型相关受益标的:汉得信息、东软集团、宇信科技、致远互联、软通动力、银之杰、风语筑、掌阅科技、蓝色光标等。
2.2.2.阿里通义大模型
2022年9月2日,在阿里达摩院主办的世界人工智能大会「大规模预训练模型」主题论坛上,阿里巴巴资深副总裁、达摩院副院长周靖人发布阿里巴巴最新「通义」大模型系列,其打造了国内首个 AI 统一底座,并构建了通用与专业模型协同的层次化人工智能体系,将为 AI 从感知智能迈向知识驱动的认知智能提供先进基础设施。
为了实现大模型的融会贯通,阿里达摩院在国内率先构建 AI 统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。通过这种统一学习范式,通义统一底座中的单一 M6-OFA 模型,在不引入任何新增结构的情况下,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务,并达到国际领先水平。这一突破最大程度打通了 AI 的感官,受到学界和工业界广泛关注。近期 M6-OFA 完成升级后可处理超过 30 种跨模态任务。
通义统一底座中的另一组成部分是模块化设计,它借鉴了人脑模块化设计,以场景为导向灵活拆拔功能模块,实现高效率和高性能。目前业界普遍认为,人脑本身由不同的模块组成,大脑中拥有储备各种知识和处理不同模态信息的能力模块,人类思考时只调用与特定任务相关的模块,正这种机制保证了人脑的高速运行。通义统一底座的另一组成部分「模块化设计」正是借鉴了这种运行机制。具体而言,模块化大一统模型采用模块化 Transformer Encoder-Decoder 结构来统一多模态的理解和生成,同时切分出不同的独立模块,包括基础层、通用层(如不同模态)、任务层到功能性模块(如推理),每个模块间相互解耦,各司其职。
通义大模型最底层为统一模型底座,中间基于底座的通用模型层覆盖了通义 - M6、通义 - AliceMind 和通义 - 视觉,专业模型层深入电商、医疗、娱乐、设计、金融等行业。
通义 - M6 已经从2020 年 6 月的 3 亿参数基础模型发展到 2021 年 10 月的 10 万亿参数全球最大预训练模型到 2022 年 1 月的业界首个通用统一大模型 M6-OFA。通义 - AliceMind 是阿里达摩院开源的深度语言模型体系,包含了通用语言模型 StructBERT、生成式 PALM、结构化 StructuralLM、超大中文 PLUG 、多模态 StructVBERT、多语言 VECO、对话 SPACE 1.0/2.0/3.0 和表格 STAR 1.0/2.0,过程中形成了从文本 PLUG 到多模态 mPLUG 再到模块化统一模型演化趋势。通义 - 视觉大模型自下往上分为了底层统一算法架构、中层通用算法和上层产业应用。据了解,通用 - 视觉大模型可以在电商行业实现图像搜索和万物识别等场景应用,并在文生图以及交通和自动驾驶领域发挥作用。阿里大模型相关受益标的:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息等。
2.2.3.腾讯混元大模型
2022年4月,腾讯对外正式宣布,腾讯“混元”AI大模型在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模态视频检索数据集榜单中先后取得第一名的成绩,实现了该领域的大满贯。这是腾讯首次对外披露“混元”AI大模型的研发进展,该模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。“混元”AI大模型基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。
MSR-VTT、MSVD、 LSMDC、DiDeMo、ActivityNet是行业内最具权威性的五大跨模态视频检索数据集榜单,主办单位包括微软、加州大学伯克利、阿卜杜拉国王科技大学等,检索库涵盖了日常生活的诸多场景,已经成为科技企业和研究机构展现AI大模型技术实力的重要的竞技场之一。
经过多年研究,腾讯广告多媒体AI团队以层次化、细粒度、高精度为目标,提出了“混元“跨模态视频检索AI大模型(简称HunYuan_tvr)。与业界其他大模型相比,团队首创了层级化跨模态技术,可将视频和文本等跨模态数据分别做拆解,通过相似度分析,综合考量并提取视频和文本之间层次化的语义关联。
这种“先分层、再关联、后检索”的交互方法,一方面可捕捉多模态(文字、视频)内部的细粒度语义信息,另一方面也能有效地检索跨模态数据间的关联性,从而大大提升了检索的精确度。
精确度的大幅提升代表国内在多模态内容理解方面的技术研究取得了新突破,这意味着计算机将进一步贴近人类对视频内容的理解与认知能力。同时,“混元”AI大模型的优越性及泛化性得到了验证,将为AI学术研究和工业级应用带来更多长期价值。
目前,“混元“AI大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中。一方面,该模型能够帮助广告创作者和腾讯平台方预测视频内容与消费者群体之间的兴趣关联,提升创作效率;另一方面,能够有效提升广告推荐的精准度,让内容搜索和匹配更加精确,有效优化用户体验。
腾讯大模型相关受益标的:博思软件、世纪华通、掌趣科技、常山北明、四维图新、泛微网络、长亮科技等。
2.2.4.华为盘古大模型
华为云盘古大模型于2021年4月正式发布,到2022年聚焦行业应用落地,已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。在华为全联接大会2022中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。
极端天气会带来巨大的生命和财产损失。华为云盘古气象大模型能够秒级预测未来7天全球天气情况,相比传统预报算法,速度提升1000倍、精度提升20%。今年8月,盘古气象大模型预测台风“马鞍”的轨迹和登陆时间,准确率达90%,远超行业平均水平。在海外,华为云为印尼打造了“国家海洋人工智能平台”,助力预测海洋灾害,保障航行安全。此外,华为云AI for Meteorology还可以用于农业、航空、航天等领域。
为了解决AI在煤矿行业落地难、门槛高等问题,华为云打造了全栈性能领先的盘古矿山大模型。只需导入海量无标注的矿山场景数据进行预训练,盘古矿山大模型即可进行无监督自主学习,仅一个大模型就能覆盖煤矿的采、掘、机、运、通等业务流程下的1000多个细分场景,让AI应用在煤矿普及更容易。
在主运场景中,基于盘古矿山大模型的AI主运智能监测系统能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%。此外,相较于人工巡检,盘古矿山大模型实现了全时段巡检,帮助工作人员及时地发现问题,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。
OCR技术是人工智能的基础之一,能够对结构多变、种类多样、来源丰富的非结构化数据进行识别与提取。传统的OCR厂商通常从特定的应用切入,陆续发展出卡证识别、票据识别、文档识别、表格识别、车牌识别、智能扫码等一系列细分OCR能力,通过组合的方式服务于各个行业。行业中每产生一个的新的识别场景,都需要在标注后才能训练一个新的模型。这使得OCR服务的开发、维护成本居高不下。
华为云发布盘古OCR大模型,通过独有的对比学习与掩膜图像建模相融合的自监督学习方法,学习并充分利用大规模的无标签数据,实现一个模型覆盖多个领域的全部通用文字识别场景,并将标注工作量降低90%。此外,盘古OCR大模型在11项经典数据集测试中取得显著的精度提升,而且与原本领先的文字识别算法相比,盘古OCR大模型的精度平均提升5%以上。
日前,华为云盘古预训练大模型通过了中国信息通信研究院首轮大模型测评,在“模型开发”和“模型能力”两部分达到当前最高标准(4+级),并在计算机视觉、自然语言处理、科学计算等领域为业界贡献了覆盖百余个业务场景的先进算法和解决方案。
华为大模型相关受益标的: 拓维信息、特发信息、润和软件、神州数码、宝兰德、创意信息、科蓝软件、软通动力、赛意信息等。
2.2.5.最新进展&研判
3 月 16 日下午,百度在北京总部召开新闻发布会,基于百度新一代大语言模型的生成式 AI 产品文心一言正式面世,官方展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。另据百度官方消息,百度将于3月27日14:00在北京总部召开新品发布会,发布文心一言云服务及应用产品。
3月22日,腾讯在业绩会上透露,未来有可能将生成式AI纳入微信和QQ。腾讯正大力投入人工智能与云基础设施建设,腾讯混元AI大模型覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业与领域模型,还推出了万亿中文NLP预训练模型。
3月23日消息,阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。据官方介绍,该整体模型参数约17亿,目前仅支持英文输入。
3月23日,华为任余承东介绍,华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。
我们认为,各大巨头目前在大模型技术上基本同源,且都具有资金、算力、人才、数据等发展条件,未来有望成为我国大模型的第一梯队。各家在应用场景上各有所长:百度具有搜索、小度智能音箱等应用场景;腾讯具有微信、QQ、游戏等应用场景;阿里具有电商、钉钉等应用场景;华为在2B应用方面独具优势。未来各家将结合自身优势,发力大模型研发及应用落地,我国的大模型产业将迎来快速发展阶段。
2.3.投资建议
百度大模型相关受益标的:汉得信息、东软集团、宇信科技、致远互联、软通动力、银之杰、风语筑、掌阅科技、蓝色光标等。
阿里大模型相关受益标的:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息等。
腾讯大模型相关受益标的:博思软件、世纪华通、掌趣科技、常山北明、四维图新、泛微网络、长亮科技等。
华为大模型相关受益标的:拓维信息、特发信息、润和软件、神州数码、宝兰德、创意信息、科蓝软件、软通动力、赛意信息等。