AI训练语料(完整版)
AI语料,即人工智能语料库(AI-C-o-r-p-us),用于训练和评估人工智能系统,尤其是自然语言处理(NLP)系统的一系列文本、语音或其他语言数据。目前大模型蓬勃发展,语料训练成了必不可少的一环
一、文本语料
1、小说语料:中文在线、掌阅科技、读课文化
2、学术语料:同方股份、中国科传、拓尔思
3、出版语料:中国出版、中信出版、中国科传、新华传媒
4、图片语料:视觉中国
5、字体语料:汉仪股份
二、行业语料
1、新闻语料:人M网、新H网
2、影视语料:华策影视、上海电影、中广天择、捷成股份
3、交通语料:万集科技、金溢科技、干方科技、通行宝
4、医疗语料:久远银海、山大地纬、贝瑞基因
5、金融语料:恒生电子、长亮科技、同花顺、大智慧
6、工业语料:容知日新、用友网络、赛意信息、汉得信息
7、教育语料:科大讯飞、佳发教育、中公教育、传智教育
8、消费语料:汇纳科技、返利科技、值得买
9、商品语料:上海钢联、卓创资讯、生意宝
10、海外语料:中国科传、中原传媒