财联社3月28日讯,据中国信通院微信公众号消息,当前大模型已呈现出产业生态不断扩大、场景应用快速涌现、商业路径逐步清晰等特点,成为现阶段人工智能产业的技术创新主线。为进一步推动我国大模型技术创新发展及工程化应用落地,中国信息通信研究院(以下简称“中国信通院”)现启动大模型技术及应用基准构建工作,针对当前主流数据集和评估基准多以英文为主,缺少中文特点、文化以及难以满足关键行业应用选型需求等问题,联合业界主流创新主体共同构建一套涵盖多任务领域、多测评维度的基准及测评工具AISHPerf-LargeModel,推动我国大模型技术及应用的引领创新。
AISHPerf-LargeModel属于人工智能软硬件基准测评体系范畴(Performance Benchmarks of Artificial Intelligence Software and Hardware,以下简称AISHPerf),AISHPerf由中国信通院牵头构建,旨在面向自主生态建设和产业实际需求,围绕AI芯片性能、算法任务表现,构建国产人工智能软硬件领域的测试基准任务,推动相关技术发展。
现在模型多为英文数据培训,百度文心画图中文翻英文再生成结果南辕北辙。我们需要自主可控的模型,信通院及国内大厂会更专注中文模型,关键问题是中文数据,那谁具有最权威的中文数据及数据确权呢?答案很明显了RMW。
其次知网的同方股份,参股美团一流科技及围绕传媒、政府等垂直领域的语料库积累已非常全面,有标识数据和模型的拓尔思.