1. 12 月 13 日消息,当地时间凌晨,大量网友反馈称ChatGPT出现报错。
2.OpenAI将付费使用施普林格旗下出版物的内容,包括美国媒体Politico和“商业内幕(Business Insider)”以及欧洲媒体《图片报(Bild)》和《世界报(Welt)》
3.今年8月16日,《纽约时报》曾称若未提前获得书面同意,原则上禁止将新闻报道和图片等用于人工智能开发。这或许是一个信号,意味着未来可供科技公司用于大模型训练的高质量数据或越来越受限。据悉,可用于训练的高质量数据或于2026年耗尽。
笔者观点:对于ChatGPT回答出现错误之前就有报道,并被怀疑是训练数据质量不佳导致,今天openAI又与出版集团签署付费购买其内容,可以验证,大模型的训练优质的训练数据将决定大模型生成内容的质量。而优质的训练数据涉及版权问题,同时,大模型要不断的迭代和更新,所以,对于拥有大量版权的公司,将通过出售数据给大模型厂家获得源源不断的收入。而多模态的训练对于图片、视频、音频等的需求远远大于文本,而多模态训练数据的价值量也远远超过文本。