微软推出多模态大语言模型 KOSMOS-1,印证大语言模型能力可延伸至 NLP 外领域。该模型采用多模态数据训练,可感知图片、文字等不同模态输入,并学 习上下文,根据给出的指令生成回答的能力。经过测试比较,KOSMOS 在语言理 解、语言生成、无 OCR 文本分类、常识推理、IQ 测试、图像描述、零样本图像 分类等任务上都取得了相比之前其他单模态模型更好的效果。
按照目前炒作AI细分,多模态这个必然要成为以后主流的路线,而除了龙头当虹一直比较强势以外,其他个股并没有跟随当前AI的热度大涨起来。
那么不喜欢追高的朋友,可以选择蹲守这个必然实现的路线。
概念股包括:
当虹科技:公司为视频编解码核心领军,视频压缩技术极大地降低带宽成本和存储成本。公司提供低延迟高密度视频编码、传输、终端适配方面的技术,拥有较为完整的VR编码解决方案,在AR、XR、裸眼3D、全息技术也有相应技术储备。在VR方面,重点提供FOV编码、传输、终端渲染等方面的技术。
魅视科技:公司自主研发的ASE计算机屏幕编码技术,实现了低带宽下视频(尤其是计算机视频)端到端无损画质的快速传输,是业内少有的同时实现低码率和高画质的图像应用技术。基于此技术,公司产品的芯片选择面广,得以引入具有强劲CPU处理能力和NPU处理能力的处理器,从而实现大范围信息资源整合。
网达软件:公司位于大视频领域,依托上亿级端到端系统的建设优势,面向运营商、媒体、金融等主要行业提供软件定制开发、媒体运营为主的技术开发服务。公司自主研发的编转码系列产品,包括网达在线编转码软件、网达分布式文件转码软件等获得了华为云鲲鹏云服务及国产操作系统统信UOS的兼容认证。
数码视讯:公司通过AI技术对视频内容分辨率进行智能提高,自动生产获取高于成像系统分辨率的图像,利用AI算法AIGC自动生产高清、超高清视频内容。
这里主要说说数码视讯。
盘后阿里也进场这条路线:阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。根据介绍,整体模型参数约17亿,目前只支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。据了解,“魔搭”是阿里达摩院联手CCF开源发展委员会在2022云栖大会推出的AI模型社区,首批开源模型超过300个,包括视觉、语音、自然语言处理、多模态等AI主要方向。
大厂进场,必然路线,板块除了前期动过一次,相比其他细分路线涨幅落后。作为300的20CM标数码视讯值博比很不错。