事件:4月27日欧洲议会成员(MEP)就《人工智能法案》达成提案,对AI模型提出更严格监管要求,包括:1)版权披露:模型开发商将被要求披露在构建其系统时使用的任何版权材料。2)公平竞争:生成式AI模型提供方不能单方面强加给中小企业和初创企业的不公平合同义务;3)保障合法权利:保障隐私、非歧视等基本权利;4)降低风险:模型发布之前需要在独立专家的参与下测试风险。
简评:
《人工智能法案》逐步完善中,或产生全球性影响。《人工智能法案》由欧盟委员会在21年4月开始起草,涵盖AI系统的定义、禁止AI应用的领域、AI系统的高风险分类、与执法机关有关的范围和规定、支持创新的措施等方面,目前仍在完善中。若通过,则该法案将成全球首个AI法律监管框架。据National Law Review,该法案将产生全球影响,其适用在欧盟区内提供的所有AI系统,无论其供应方来自当地还是英美等第三方国家。
此外,据路透社报道,七国集团(G7)的数字和技术部长也在4月30日提出,将“基于风险”推出一项针对人工智能的监管法案,未来将召开关于生成式人工智能的讨论,包括如何保障知识产权、促进透明度、解决虚假信息等主题。
近期提案对模型的版权披露等提出监管要求,关注后续进展。22年12月,欧盟理事会通过了关于《人工智能法案》的共同立场,旨在确保在欧盟区使用的AI系统的安全。23年4月27日,据Euractive报道,欧洲议会成员(MEP)就《人工智能法案》达成提案,对生成式AI模型提出更严格监管要求,并表示无论AI模型采用何种分发渠道、开发方式、训练数据类型,都必须遵守。具体包括:
1)版权披露:生成式AI模型开发商将被要求披露在构建其系统时使用的任何版权材料,且需要在审查数据来源的可持续性、可能的偏见等方面,采取数据治理措施。
2)公平竞争:禁止生成式AI模型提供方单方面强加给中小企业和初创企业的不公平合同义务,以保障中小企业和初创企业的利益,无论是API方式还是训练模型转移的方式。
3)保障合法权利:生成式AI模型应保护隐私,也单独提出禁止在执法、边境管理、工作场所和教育领域,使用情绪识别类人工智能软件;此外,要求模型遵守的原则包括人力代理和监督、技术稳健性和安全性、透明度、多样性、不歧视和公平、尊重言论自由等。
4)降低风险:生成式AI模型必须在欧盟数据库中注册,在模型发布前需要在独立专家的参与下,测试减轻对健康、安全、基本权利等可预见风险,且在其整个生命周期中保持适当的性能、可纠正性、安全性等。
后续,在5月11日的关键委员会投票前,该提案可能仍需在技术层面进行细微调整,全体投票则预计在6月中旬进行。
我们认为,本次《人工智能法案》的提案中,最值得关注的要求在于“要求披露模型在构建其系统时使用的任何版权材料”,这是对数据/版权供应方在生成式AI产业链地位的进一步肯定,版权方的权利也将在未来获得法律的保护。
1)地位得到法律确认和保护:生成式AI会从公开网站或专业数据库获取大量素材作为训练数据,素材的提供方理应当享有AI生成内容所带来的收益。但因素材来源庞杂、追溯确权困难、模型方版权保护意识尚未形成等原因,模型生成的内容并不会披露所依据素材的来源,容易引发侵权问题。此前全球最大的专业图片库公司Getty Images就起诉Stability AI从网站上窃取了数百万张图片。
欧盟《人工智能法案》提案中的上述要求,意味着大模型调用训练素材的行为将得到监督,数据和版权方的权益将得到保护,他们也从而获得主张更多权利的机会。
2)数据资源商业化有望得到法律支持:当数据供应公司、个人创作者等素材供应方,以单独个体被大模型公开披露时,其可在法律的保护下,向大模型寻求对生成内容收益的分成,实现数据资源变现。
结合欧盟本次《人工智能法案》提案、Reddit等互联网平台对大模型公司调用API收费,及网信办《生成式AI服务管理办法(意见征求稿)》,可以看到从政策法规到实际产业界的探索,在人工智能大模型火爆的当下,数据及版权保护成为重要议题。我们认为,大模型为具有版权的数据资源进行付费,将成为生成式AI的产业趋势。具有海量优质版权、数据资源的公司将充分受益。从产业优先级来看,基于大语言模型训练,文字类版权将率先受益。后续则为图片、视频类版权。