一、没有海天瑞声的训练数据,虚拟人只是个三维动画
虚拟人只有应用了海天瑞声这类公司的这些训练数据再辅以算法,才能做到:
1)虚拟人才能越来越聪明:才能与人交互,去理解人类通过语音、手势、表情、唇动所表达的意思,才能知道自己所处何地何时,外面天气如何等等等。。。。
2)虚拟人的表现才能越来越完美:才能有越来越自然丰富的面部表情、嘴唇动作与身体姿态,越来越像人,最终变得比人还要完美。而不是个虚拟机器,才能让他/她为它着迷,甚至爱上虚拟人角色。
所以就像海天瑞声自己所说:训练数据是人工智能的基础,虚拟人是人工智能的前卫表现形式之一。
二:海天瑞声是训练数据领域国内领先提供商和服务商,A股唯一标的。
深耕AI数据服务领域16年的海天瑞声,产品能力涵盖智能语音、计算机视觉和自然语言3大领域,自有训练集数据产品数量位居行业领先。公司的产品和服务已获得脸书、阿里巴巴、腾讯、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认可。目前公司客户累计数量超500家,覆盖了主要的大型科技公司、人工智能企业及科研机构。
海天瑞声多年积累的核心技术中,多语种多模态训练数据设计技术可结合具体业务场景、应用领域特性,设计匹配的、可用于算法模型开发、训练、拓展优化的多模态数据方案,其中包含实现多语种语料同步处理、多语种音素均衡设计及自动切分与文本对齐等多项自研处理工具;海天瑞声自研多模态多通道数据采集技术可实现多通道录音、跨模态数据采集及内容分析等,例如可通过多终端设备同时获取被采集对象的面部三维表情、对话语音信息、唇部动作信息、声音来源方向信息等多维度信息,;
海天瑞声目前已经在视频摘要、视频场景分类、视频搜索、多模态问答、智能驾驶、虚拟客服等数十个场景为客户提供多模态数据解决方案;
海天瑞声自有知识产权数据集产品中包含多个即买即用的多模态数据产品,King-AV-028、King-AV-018等,其中King-AV-018是针对虚拟主播需求开发的视频训练数据集,包含250个中国人的唇语视频信息,采集过程将语音数据采集设备叠加针对唇语信息的视频采集设备,运用自主研发的多模态数据采集软件同时录入不同硬件设备的数据,并保持了多维度数据的对齐。
三、海天瑞声已经给从事虚拟人领域的客户提供过训练数据产品或服务。
疑似给脸书提供虚拟人业务数据?
四、从竞争对手看,可能也是世界领先
海天自己说是国内领先,行业领跑者,从事同类业务的公司,世界上基本就这四家,海天瑞声说是世界领先也不为过。
免责声明:根据公开数据整理,据此操作自负盈亏