【申万传媒】AI数据重要点评:海外社区拟收费,出版语料库/影视版权等价值重估
事件:海外知名社交媒体平台Reddit宣布将向过度使用其数据API的公司收费,新增条款禁止通过任何方式访问或使用Reddit服务和数据来训练大型语言、人工智能或其他算法模型。
大模型时代语料价值凸显,海外调用API收费商业模式逐步明朗。(1)Reddit是美国访问量最大的社区之一,是首次有社交媒体公司明确向AI训练收费。(2)海外图片托管服务商Shutterstock已把图像数据出售给OpenAI,Twitter计划针对API使用收费。
国内相关管理规范逐步完善,语料价值有望重估。4月11日,网信办《生成式人工智能服务管理办法(征求意见稿)》,其中提到:提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。用于生成式人工智能产品的预训练、优化训练数据,不含有侵犯知识产权的内容。
投资上看,一方面掌握了高质量数据的垂直场景是AI时代重要卡位;另一方面,文字图片视频版权作为AI模型训练的数据,有望价值重估。
相关标的:
1)文字:出版语料(中信出版-积极拥抱AIGC、中国科传-专业数据库、中国出版-典籍库),线上文字语料(阅文集团、中文在线等)
2)视频影视:光线传媒(动画IP)、华策影视(影视版权库)、中国电影(滞涨国企)、上海电影、JCGF等
3)关注ai数据审核相关标的:新H网、人M网