异动
登录注册
文生视频”多模态应用发展路径
专注次新华仔
无师自通的老司机
2023-12-01 18:33:11

市场认为,AI概念已经逐渐步入成熟期,但未见杀手级应用。实际上,无论是大模型、算力、数据仍处于通用AI的发展初期,从全球巨头的动作看,“合纵连横”亦初现端倪。本篇报告中,我们深度剖析“文生视频”这未来一多模态应用发展路径,可见AI应用的发展尚处于早期,相应地,算力需求远未见顶,AI生态的整合正在进行中。

(1)文生视频是多模态AIGC圣杯,优化迭代速度慢。视频是多帧图像的组合,然而文生视频在文生图的基础上增加了时间维度,技术实现更困难。即便是Meta和Google这样的硅谷人工智能巨头,在文生视频上进展缓慢,它们分别推出的Make-A-Video和Phenaki均尚未公测。

(2)文生视频底层模型及技术仍在优化,未筛选出最优模型。文生视频技术主要发展过程经历了基于GAN和VAE、基于Transformer模型、基于扩散模型三个阶段。目前主流的文生视频模型主要依托Transformer模型和扩散模型。1)基于Transformer的代表Phenaki突破了视频生成时长限制,但效果相对粗糙缺少细节。2)基于扩散模型的代表Make-A-Video重在提升视频质量,但其视频时长均在4s以内。

(3)文生视频效果各异,总体质量较低。当前文生视频可公测应用较少,仅有RunwayGen-2、ZeroScope及Pika Labs等少数几个,它们有如下共同问题:1)复杂人物动作生成帧连续效果较差;2)非日常场景的视频架构能力连续能力一般;3)多主体视频生成缺乏逻辑连续性等。

(4)文生视频当前商用化程度较低,可从图片生成看其商业前景。1)根据七麦数据,图片生成类应用在多模态大模型中,表现出较强的收费能力,应用数量上占比最高。2)当前唯一收费的文生视频应用(Runway Gen-2),商业模式与图片生成趋同,即主要按照生成量定价。

看好人像生成细分领域,但营收持续增长能力仍待验证。1)Lensa AI推出人像生成功能后,去年12月前12日内创收2930万美元,但2023年7月全球收入已回落为100万美元;2)妙鸭相机上线即火爆,半月营收估计超过29万美元,后续须上线新模板、新玩法维持营收增长。

看好算力储备大厂在多模态生成领域的发展。1)文生图应用Midjourney日活达1500万,年收入超1亿美元,它推出的多版无限量套餐、高速GPU服务反映出市场对算力的巨大需求。2)目前国内文生图多为计次付费,尚未出现无限量套餐,或因算力受限,我们认为,具有算力储备的云服务厂商在发展视频生成类应用上具有天然优势。

看好业务协同向发展,看好文生视频与文生图、图生视频的联动。AI对产品价值的拉动表现为:1)促活、拉新:Adobe、MiCROsoft 365 Copilot分别在软件原有基础上推出AI工具;2)提升产品价格:Office Copilot是基于GPT-4 API的应用,Copilot加入后Office当前四种商业版整体订阅价格涨幅达53-240%。我们看好文生视频能与原有产品产生协同,降本增效的公司,例如游戏、影视制作等领域的公司。

投资建议:

1)算力:AIGC蓬勃发展的基石,建议关注光通信,包括中际旭创、天孚通信、新易盛、太辰光、德科立;算力设备:盛科通信、恒为科技、锐捷网络、寒武纪、美格智能、紫光股份、工业富联、中兴通讯等;算力租赁:并行科技、中贝通信、云赛智联等;

2)模型层:建议关注万兴科技、金山办公、科大讯飞等;

3)应用层:看好游戏的迭代创新,建议关注恺英网络、神州泰岳、盛天网络、游族网络等。

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
并行科技
S
中贝通信
S
森远股份
S
昆仑万维
S
鸿博股份
工分
6.14
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 东方长红8888
    超短低吸
    只看TA
    2023-12-01 19:14
    还要再下来
    1
    0
    打赏
    回复
    投诉
  • 1
前往