文本语料 :中原传媒集团下属大象出版社与施普林格-自然集团签订“中国汉学研究史论丛书”中英文同步出版协议,公司将成 为国内首家与 OpenAl达成间接合作的出版社。新华传媒 公司旗下所属有《财联社》《澎湃》等30多个知名媒体平台,涵盖财经、民生、时政、教育等几乎所有领域,拥有全领域全方位的高质量已标注语料库(免审)。掌阅科技公司在文学和阅读领域的版权储备业内领先,这些中文语料可以用于网文 行业垂类模型训练。中文在线 公司深耕文化数字产业,拥有海量的正版中文数据资源,数据总量超过60TB,旗下各个平台每天还会产生数以亿计的文字内容。读课文化 公司从国内原创小说起步,打通了版权获取渠道和积累了优质的作者团队,已与包括全球四大版在内的数十家版权代理公司保持着长期稳定的合作关系。 荣幸文化公司成功打造了一系列适合0-14岁中国少年儿童阅读的图书,覆盖了少儿科普百科、卡通/漫画/绘本、少儿文学等多个少儿图书领域。视频语料:中广天择 近期公司已经与万兴天幕大模型签订战略合作协议,并达成视频语料方向 的战略合作。
捷成股份
前拥有新媒体电影版权4803部。公司是国内影视剧版权运营龙头,目 图形语料 :视觉中国集团拥有近万名签约摄影师和艺术并同海内外数百家图片社、影视 机构、版权机构广泛合作。 金融语料 :同花顺公司自研的问财HithinkGPT大模型,预训练金融语料达到万亿级涵盖金融行业多方面数 据,具有全面的实时金融数据、强大的语义理解。 消费语料 :汇纳科技公司自成立之初即致力于线下消费行为数据分析,旨在“成为中国最大的线下消费数据提供商”。 值得买公司基于通用模型,利用自身有特色的数据资源和语料库,自研了值得买 消费大模型 医学语料 :贝瑞基因公司年产出的基因数据量已超过PB级已建立几十种科研服务细分产品类型并基于特有的数据库资源及云计算平台。卓创资讯是专注于大宗商品市场数据监测、交易价格评估、行业数据分析及行业研究的专业服务提供商。
作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内可能择机卖出。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。