海天瑞声(688787.SH)
AI 算法的“加油站”
国内领先的 AI 模型训练数据提供商。公司成立于 2005 年,专注于将自然数据源专业化加工为可供 AI 公司训练使用的工程化数据集,可谓 AI 算法的“加油站”,已经覆盖微软、腾讯、百度、科大讯飞等头部 AI 企业客户。公司核心团队具备学术与行业背景,为公司长期发展打下坚实基础。虽然疫情带来短期扰动,但公司收入利润整体持续快速增长,2016-2020 年营业收入 CAGR 为 29.02%,归母净利润 CAGR为 68.06%,标准化程度较高的数据库产品收入占比持续提升至 21Q1 的 56%,毛利率近年来稳定在约 70%。
AI 商业化打开数据服务市场百亿级空间,算法迭代、场景创新驱动行业成长,有望带来市场集中度提升。1)AI 已进入全方位商业化阶段,全球产业规模超 500 亿美元,国内市场规模超 400 亿元,中国 AI 基础数据服务市场处于快速成长期,2025年有望突破百亿规模。2)AI 基础数据服务上承数据生产者,下接 AI 应用方,是 AI落地过程中不可或缺的一环。我们认为,机器学习算法迭代的天然需求与应用场景的创新是 AI 基础数据服务行业扩张的主要驱动力,一方面专业化的训练数据是当前AI 算法发展迭代的刚需;另一方面深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求,需要专业数据商提供服务;此外,智能物联网、产业互
联网等新型场景催生增量新需求。3)当前 AI 数据服务市场行业集中度较低,2019
年 CR5 仅 26.2%,未来随着市场需求向精细化转型,我们预计市场集中度将进一布提升。
一体化平台的根基是算法、资源和经验,数据积累带来规模效应和粘性,多领域、多语种能力打开成长空间。
1)公司基于核心算法打造“从设计到质检”的一体化平
台,赋能数据生产全流程,高效实现大规模数据加工质检,形成核心技术壁垒,我们认为竞争优势背后是技术、资源以及对垂直行业的理解。
2)“数据积累—技术迭代—提升数据质量”的闭环带来明显的规模优势,对垂直行业 Know-how 的理解拓宽公司的竞争护城河,而头部客户的高复购率也显示了产品的高粘性,进一步带动公司对行业 Know-how 的理解。
3)产品能力涵盖智能语音、计算机视觉和自然语言3 大领域,自有训练集数据产品数量位居行业领先。虽然短期受到疫情扰动,但是我们认为多领域多语种的覆盖能力将打开公司的全球化成长空间。
首次覆盖,给予“买入”评级,2022 年目标市值 72 亿元。我们预测公司 2021-2023年收入分别为 2.82/3.99/5.47 亿元,对应归母净利润 0.84/1.18/1.61 亿元;横向比较的 AI 公司的 2021 年 PE 均值约为 61 倍,考虑到公司在 AI 数据训练行业的稀缺性,给予 2022 年目标市值约 72 亿元,给予“买入”评级