三星泄密事件和意大利因为隐私保护而停用chatgpt再一次将人工智能推上了风口浪尖,仔细阅读全文你会发现,实际上是chatgpt将以上数据用来训练了。这让我想起同样推出AIGC功能的Adobe在推出此功能之初便将版权保护放在了第一位!
对于外界最为关注生成式AI带来的侵犯版权问题,也是Adobe反复强调与市面上的“AI作画”公司的关键不同。目前,图片库服务商的Getty Images正在跟AIGC独角兽公司Stability AI打官司,指控对方未经许可或提供补偿就从其图片库复制了超过1200万张图像做训练。一批海外艺术家也在组织发起对Midjourney、Stability AI侵犯著作权的集体诉讼。
据介绍,Firefly背后的第一个大模型完全是在 Adobe Stock 、再加上公开许可授权內容和版权过期的公共领域內容上做训练。Adobe Stock 是Adobe自建的商用图像数据库,含有超3.2亿张专业级且获许可的图像素材,被外界认为是其规避版权风险的天然壁垒。
Adobe目前也正在为Stock的内容贡献者开发一种获得收入的新模式,帮助创意变现,Firefly测试完成后将公布详细信息。
Adobe透露,正式产品上线后,将会为用户提供“不能用于训练”(Do Not Train)的标签 。他们可以自主选择自己原创的内容产品不能用于AI大模型的训练。无论在何处使用、发布和保存内容时,该标签都将与内容保持关联,加强可追溯性和可认证性。
聂双艺告诉界面新闻,合规是商用的第一道门槛。未来的Firefly模型将运用来自Adobe、其他公司的各项资产、技术和培训数据。从Adobe的角度出发,不仅是在模型训练阶段融入了对合规的考量,未来其会延续优先关注人工智能潜在的风险。