#出处未知,来源未知,注意风险#
七部门联合发文的那个其实很多内容是之前被强调过很多次的,包括数据安全合法等等。我看到的只有第七条,对于人工智能服务提供者的预训练进行管理,最新提出的内容。
人工智能服务的提供者,也就是大模型的厂商,无论他们的模型输出的是文字、图片、视频还是音频,都需要大量的物料进行训练,之前对于训练的物料是否有版权这个问题没有做过明确的规定,现在,规定就很明确了,涉及知识产权的,训练要不侵权;涉及个人信息的,要征求别人同意。
之前中国科传、中国出版、rmw等炒作过一波,之前炒作逻辑是因为AIGC的诞生,大量的AIGC产品会出现,这些产品需要做版权标注,产品体量级别的增长,版权标注业务也会体量级别的增长。就比如我自己,我小学画画水平可以拿midjourney画出非常专业漂亮的图,可以用GPT写小说,每个人都可以做音乐、写文章,我们不去考虑他们的产出有没有价值,但这个增长的量是空前的。
随着这次炒作过后人工智能的调整,也结束了他们的一波高潮。
但该办法一出,这次炒作的逻辑发生了微妙的变化。前文讲过,这些人工智能大模型的厂商,如果想要让他们的模型越发的强大,就需要更大量、精细的物料去训练,而往往很多物料获取是需要版权的。打比方说,让语言模型写一段:以白居易诗为风格描述春天西湖的古诗。因为白居易的诗不存在版权,所以你可以拿来随便训练。如果换一句呢:以JK罗琳的风格描述春天西湖爱情故事的英文短文。【哈利波特】可是要版权的,这个训练素材就不能随便用了,就要交钱了。所以,像图片的训练,音乐的训练物料,影视剧的版权,涉及版权的训练物料都要付费了。
既然这样,国内手握大量版权的公司理所应当成为了获益方。(华策影视(超两万集重点影视剧版权),中文传媒,中国科传,中国出版