传音有多模态AI技术积累!?
以下皆为传音控股2022年中报原文:
1、垂直领域多模态感知与交互技术研究
目标:在契合目标市场的热门垂直领域上构建多语种、多模态的智能感知与交互方案。
技术:通过目标市场热门垂直领域的海量语料库及多语种、多模态的感知与交互全链路技术,提供良好的本地化交互体验。
应用:通过垂直领域的交互体验提升及多模态交互带来的沉浸感来增加目标用户群体粘性,应用于智能设备上的人机交互入口与娱乐、工作等场景。
2、全场景智能平台建设
目标:构建 AI 技术端、云服务平台,围绕目标市场用户的本地生活场景与设备使用习惯提供精准服务与资源优化。
技术:基于场景与特征信息,多维度的语音视觉信息,借助语义理解、信息抽取、视觉理解、机器学习等算法技术,实现场景与情境的智能识别并精准服务,提高效能。
应用:广泛应用于本地用户工作生活的各场景与情境的感知理解,提供精准个性化服务;同时也应用于业务经营的全链条,达到降本提效的作用。