2022年12月,OpenAI发布了对话式AI新模型ChatGPT,一经面世就引发科技界的巨大关注。
该模型是OpenAI基于先前推出的NLP预训练模型GPT-3.5之上的衍生产品,使用简单,只需向ChatGPT文字提出需求,即可让其完成回答问题、书写代码、创作文本等指令,根据用户输入的文本,完成智能内容生成并回复内容。
ChatGPT可以通过从数百万个网站收集信息,以对话式、人性化的方式生成独特的答案,能在一定程度上替代搜索引擎。
Chat 强调了其为了对话而优化,具有记忆能力,可以完成连续性对话。
GPT即生成型预训练变换模型,是解决NLP(自然语言处理)任务的训练模型之一。该预训练模型基于Transformer架构(具有自注意力机制,可以捕捉句子中的上下文关系),可以根据给定文本预测下一个单词的概率分布,从而生成人类可以理解的自然语言。
它代表了OpenAI最新一代的大型语言模型。
ChatGPT 的算法突破带来了 NLP (自然语言处理)技术上限的进一步提升,有望加速 NLP 技术在在机器人、人机交互、智能客服、语音对话、AI视觉、AIGC、智能公文写作等领域持续落地的应用,预计到 2026 年国内 NLP 带动相关产业规模有望破千亿。
01
ChatGPT的源头公司:OpenAI
2015年,OpenAI由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立。
2016年6月,OpenAI宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。
其使命为确保通用人工智能(ArtificialGeneralIntelligence,AGI),即一种高度自主且在大多数具有经济价值的工作上超越人类的系统。
图片
OpenAI主要投资者包括微软、ReidHoffman’scharitablefoundation和KhoslaVentures。
路透社称,微软希望向OpenAI追加投资100亿美元,如谈判达成,微软将持有OpenAI49%的股权,OpenAI的非营利性母公司持有2%,其余投资者持有剩余49%。
据外媒TheInformation 报道显示,微软可能会在 2023 年 3 月之前在 Bing (必应)中应用 ChatGPT,用人工智能 来回答一些搜索查询。若 Bing 引入 ChapGPT,有望以完整句子的形式呈现搜索 结果,这一举措或将改变搜索引擎的运行模式,革新性地提升搜索引擎效率。
OpenAI2022年营业收入约8000万美元,且据OpenAI预测,2024年营业收入有望高达10亿美元。
02
ChatGPT 基础设施核心环节梳理
ChatGPT上线象征着文本类AI进入新阶段,利好其基础设施及应用。
算法、芯片、存储、数据和算力是AI大模型训练的基础。
1. 云基础设施
国内云基础设施方面,Canalys统计2022年第三季度中国云基础设施服务支出达到78亿美元,同比增长8%。
“中国四朵云”(阿里云、腾讯云、华为云、百度云)格局未变,合计占据80%市场份额。
图片资料来源:canalys
国内云基础设施主要参与者还包括中国移动、中国联通、中国电信、微软、深桑达(中国电子云成为央国企和地方政府开展国资云建设的主力军)、易华录(参与政务云建设,数据要素市场化先发优势显著)等。
2. AI芯片
中国AI芯片市场入局者众多。
海思半导体已成为国内营收规模最大的集成电路设计企业,以昇腾系列为主要GPU产品,在AI终端芯片具有优势。云端领域,百度可提供云上GPU服务器;海光信息、天数智心与登临科技均以GPGPU为主打,是国内特定细分领域的主要竞争对手。
芯片领域主要厂商还包括富瀚微、国科微、北京君正、华为海思、星宸科技等;存储器主要厂商主要是长江存储。
3. 数据
数据集作为数据资源的核心组成部分,是指经过专业化设计、采集、清洗、标注和管理,生产出来的专供人工智能算法模型训练的数据。
目前我国的数据标注与审核业务的参与者主要包括两类,一是人工智能公司内部的标注部门,二是商务流程外包公司。
主要厂商包括海天瑞声(AI训练数据专业提供商)、京东众智、慧听数据、龙猫数据、数据堂、曼孚科技、星辰数据、倍赛、蚂蚁众包、云测、爱数智慧等。
4. 对话交互类AI算法
当前国内领先的对话交互类AI算法企业主要包括两类:
以语音识别为核心业务的企业,延生到NLP领域,如科大讯飞,从语音识别延生到语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等算法,并在消费者、智慧教育、智慧城市、智慧司法、智能服务、智能汽车、智慧医疗、运营商等领域实现深度应用。
以NLP为核心业务,专注语义识别的企业,如拓尔思。拓尔思是国内最早从事自然语言处理(NLP)研发的企业之一,在语义智能领域具备自主可控的底层技术,可以提供预训练模型和阅读理解等技术成果。
ChatGPT作为一种NLP模型,其算法突破带来了NLP技术的进一步提升,有望加速NLP技术在各行各业、各个领域的应用,例如智能语音、智能客服、各类机器人等,NLP领军企业有望核心受益。
科大讯飞的壁垒来源于语义和场景,消费品、汽车、教育、医疗背后都是语义和场景,未来各垂直领域的AI落地有望快速增长。
拓尔思依托NLP拥有强大的数据获取分析能力,各类知识库与数据资产为公司带来行业领先的语义理解能力。
产业链布局相关厂商还包括初灵信息、慧博云通、信雅达、云从科技、天玑科技、科大国创、高伟达、神思电子、高鸿等。
5. AI 视觉
纵观AI视觉相关产业链,从元器件到集成商,国内厂商均有完善的布局,且在全球竞争中处于优势地位。
人工智能图像识别技术已经进入广泛落地阶段,国内AI视觉领军企业已将技术应用于安防、工业、文旅等领域,为各行各业提出了智慧化解决方案,有效降本增效。
如华为海思的安防芯片、韦尔股份的CIS图像传感器、宇瞳光学的安防镜头、舜宇光学的镜头、海康威视和大华股份 的安防、以及华为的自动驾驶能力等等,在全球中均处于领先地位。
AI视觉产业链各环节中:
图像传感器领域主要玩家包括韦尔股份、格科微等;光学镜头主要厂商有舜宇光学、联合光电、凤凰光学、联创电子和宇瞳光学等。
安防领域主要玩家包括海康威视、大华股份、商汤科技、旷视科技等;工业自动化主要厂商包括基恩士、康耐视、奥普特等。
部分行业巨头纷纷向上下游或横向延伸,开展行业整合,行业的集中度将进一步集中,伴随着AI视觉的进一步发展,率先入局的行业龙头公司将充分享受行业发展的红利。
03
ChatGPT 落地场景丰富,加速AIGC发展
目前OpenAI开发的ChatGPT可以实现:1)相应用户输入并生成类似人类的文本;2)可生成多种格式和样式的文本,例如段落、列表和要点;3)帮助程序员调试代码或给出建议;4)提供时事(实时性较弱)、历史、科学等各种主题信息。
ChatGPT作为文字模态AIGC发展潜力大,落地场景丰富,未来可以与图形模态的AIGC相结合,打造从文字描述到图片生成的AI辅助工具。
ChatGPT上线推动文本类AI渗透于文本生产、智能批阅等应用领域,同时其对训练模型的改进对AIGC的全面发展有广泛意义。
相关领域布局的企业包括微软、Meta、百度、阅文集团、视觉中国、中文在线、粉笔等。
随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,AIGC 有望加速发展,成为多产业智能发展新引擎。