异动
登录注册
传音控股:顺势而为,借势发挥。
丁 元英
2023-04-03 14:20:54
chatgpt的火不是一时迸发的的


国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点出 2022 年值得人们期待的五个人工智能发展趋势。

随着深度学习的开放,人工智能在几年中快速发展,尖端技术慢慢向普及应用到各行各业。以下是国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点的 2022 年值得人们期待的五个人工智能发展趋势。

趋势 1:大型语言模型(LLMs),定义交互式人工智能的下一个浪潮

人工智能的语言模型是基于自然语言处理技术和算法创建的。比如在某一句话说一半的时候,这个模型会根据以往记录的实例,来推断出这句话后面的几个字。总的来说就是总结文本信息,甚至从纯文本中创建视觉图表。

大型语言模型(LLMs)是在包含巨大数据量的大规模数据集上训练的。像是 Google 的 BERT 和 OpenAI 的 GPT-2 和 GPT-3 就是 LLMs 很好的例子。据了解,GPT-3 中约有 1750 亿个参数,在 570 千兆字节的文本上进行训练。这些模型生成的东西可以从简单的文章到复杂的金融模型。现如今,包括 OpenAI、Hugging Face、Cohere、AI21 Labs 以及 AI12 在内的人工智能初创公司,正在通过训练具有数十亿参数的模型来推动 LLMs 的发展。

在 2022 年,我们将看到大型语言模型成为下一代交互式人工智能工具的基础模型。

 

趋势 2:多模态人工智能的崛起

" 模态 "(Modality)是德国理学家赫尔姆霍茨提出的一种生物学概念,即生物凭借感知器官与经验来接收信息的通道,如人类有视觉、听觉、触觉、味觉和嗅觉模态。多模态是指将多种感官进行融合,而多模态交互是指人通过声音、肢体语言、信息载体(文字、图片、音频、视频)、环境等多个通道与计算机进行交流,充分模拟人与人之间的交互方式。

传统的深度学习算法专注于从一个单一的数据源训练其模型。例如,计算机视觉模型是在一组图像上训练的,NLP 模型是在文本内容上训练的,语音处理则涉及声学模型的创建、唤醒词检测和噪音消除。这种类型的机器学习与单模态人工智能有关,其结果都被映射到一个单一的数据类型来源。而多模态人工智能是计算机视觉和交互式人工智能智能模型的最终融合,为计算器提供更接近于人类感知的场景。

                            

 

多模态人工智能的最新例子是 OpenAI 的 DALL-E,该模型使用艺术家萨尔瓦多 - 达利和皮克斯的瓦力的谐音来命名。它可以从文本描述中生成对应图像。例如,当文本描述为 " 一个甜甜圈形状的时钟 " 被发送到该模型时,它就可以生成以下图像。

谷歌的多任务统一模型(MUM)是多模态人工智能的另一个例子。它承诺通过从 75 种不同语言中挖掘出的上下文信息对用户搜索结果进行优先排序,从而提高用户的搜索体验。MUM 使用 T5 文本到文本框架,比 BERT 中流行的基于变换器的自然语言处理模型要强大 1000 倍。

英伟达的 GauGAN2 模型则将根据简单的文本输入生成照片般逼真的图像。它在一个单一的模型中结合了分割映射、内画和文本到图像的生成,使其成为一个强大的多模态工具,可以用文字和图画的混合来创造逼真的艺术。

在不远的未来我们就可以见到计算机视觉、语言以及语音模型的融合,这使得人工智能更丰富,更自然逼真。

趋势 3:云平台新的垂直化人工智能解决方案

世界领先的人工智能供应商,包括亚马逊、谷歌和微软,都正专注于将研究和开发工作商业化。他们通过旗下的云平台提供托管服务,并建立硬件设备,配备人工智能加速器和针对特定场景的预训练模型。

亚马逊连接和谷歌联络中心 AI 是垂直整合的典型例子。两者都利用机器学习能力来执行智能路由,由机器人驱动的客服对话,以及对联络中心代理商的自动协助。AWS Panorama 可以连接到现有的 IP 摄像机,以此来执行基于计算机视觉的推理。客户可以在其云平台训练新的模型,并将它们部署在全景设备的边缘。Azure Percept 采用了类似的方法,在边缘提供计算机视觉模型和交互式人工智能。微软基于 Azure 上现有的物联网、人工智能和边缘计算服务建立了 Percept。

最后,亚马逊 Lookout for Equipment 和谷歌 Cloud Visual Inspection AI 等服务,利用基于云的人工智能平台,对设备进行预测性维护和产品的异常检测。这些服务是专为零售和制造业定制的。

篇幅问题,还有两个趋势就不过多介绍。

传音控股 688036:早已布局多模态感知与交互技术及全场景智能平台建设。

 深化多元战略布局,大力发展扩品类业务。公司在保持新兴市场智能手机领域领先地位的同时,积极探索新的合作与商业模式,基于在新兴市场积累的领先优势,深化多元化战略布局,打造线上+线下完整渠道,加快发展移动互联、扩品类等业务。公司创立数码配件品牌oraimo以及家用电器品牌Syinix。Oraimo产品包括TWS蓝牙耳机、智能手表、蓝牙音箱、吸尘器等。Syinix家用电器包括智能电视、空调、冰箱等。我们认为,公司发展扩品类业务在技术、品牌、渠道方面优势极大,与公司智能手机、移动互联业务联动打造智能生态格局已现。

  持续科技创新投入,加大产品及移动互联等研发投入。公司2022年前三季度研发投入达到15.02亿元,同比增长44.84%,占营收比重达到4.17%。公司将技术创新作为核心战略之一,始终保持高强度研发投入,在多语种智能语音助手、5G、芯片定制、折叠、AIoT互联互通等核心技术赛道持续加大研发投入,在AI语音识别和视觉感知、拍照算法、智能充电、智能数据引擎、云端系统软件等领域开展创新研究。

  AI发展进入新时代,AI+硬件迎来新机遇。信息与通信技术的发展带来智能硬件产品种类与规模的快速增长,而AI的接入与应用将会持续赋能多样化的智能硬件设备,为智能产品创新方向。除浏览器之外,ChatGPT已成功实现接入智能音箱、智能手表等智能硬件,我们认为ChatGPT在智能硬件的应用落地有望率先作为AI语音助手,极大提升用户体验。公司深耕海外市场,智能手机基本盘稳固,已具备智能耳机、音箱、手表以及智能家电等全面的产品卡位,有望直接受益于AI+硬件带来的全新发展机遇。

 

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
传音控股
工分
1.63
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据