1 人工智能领域:公司是国内最早从事自然语言处理(NLP)研发的企业之一,在 NLP、知识图 谱、OCR、图像视频结构化领域都具备自主可控的底层技术,处于行业领先地位。 2
2 大数据领域:公司是最早从事中文全文检索技术研发的企业,具有全球领先的 智能检索技术,现已将领先优势拓展到数据采集、治理、分析挖掘等大数据核心技 术的全生命周期,所有底层技术均自主可控。
3 数据安全领域:公司子公司天行 网安是国内最早从事网络安全和数据交换的企业,发明了国内第一台安全隔离网 闸,在数据视频交换、单向导入等方面具有雄厚的技术实力。
最近随着chatgpt的爆火,大a在开年后也迎来了人工智能的大周期。这一两周在汉王的带领下chatgpt板块一路向上,势不可挡。在多日的研究后发现拓尔思是chatgpt板块里非常稀缺的一个标的。公司本身在NLP领域深耕多年,人工智能主要业务面向政府、金融、互联网平台、教育等,业务渠道丰富,市场份额位居前位。
从业务构成来看,拓尔思是领先的大数据、人工智能、数据安全产品
和服务提供商,主要有4大类业务,大数据软件产品及服务+人工智能软件产品及服务贡献了70%以上的收入、毛利率均在70%以上,下游行业客户构成主要集中在政府及关基行业,公司自然增长相对稳定,2012-2021 年收入复合增速近 20%、归母净利润增速达14%。这是在chatgpt板块少有的能持续盈利的公司。
1、数据
对于chatgpt来说,数据与算法是核心。高质量的数据才能训练出较为理想的人工智能,高质量数据对AI模型的重要性不言而喻,在互联网上充斥无数的无用和垃圾信息,所以数据标注清洗就显得尤为重要了。清洗得到的高质量数据集建设必须由训练模型的研究员或者工程师亲自参与,反复迭代,大模型时代,好数据比好模型重要N个数量级。拓尔思有着自己的大数据中心和TRS人工智能平台,有着日均亿级的数据获取能力,能对千亿级的数据进行清洗标记、挖掘分析,这对于训练出好的AI模型是至关重要的。
公司从事数据资源的收集和加工已经超过10余年,2010年起自建大数据中心,目前所积累的开源情报和授权数据已经超过千亿条,日均数据获取超亿条。在数据检索方面,公司具有万亿级数据总量的秒级检索能力。数据处理方面,基于大数据、行业知识图谱与深度学习等技术的深度融合,公司构建了完备的语义智能技术体系,具备数百类知识图谱的快速构建能力。有数千台数据采集和分析服务器分布在目前启动建设的国家算力枢纽节点京津冀、长三角、粤港澳大湾区、成渝等地。公司历时十年构建了从数据积累到人工智能软件产品的完整链条,包括大数据获取的网络信息雷达系统,大数据治理的分布式数据整合系统,大数据检索的海贝大数据管理系统,人工智能通用技术平台的TRS DL-CKM自然语言处理引擎(基于深度学习的自然语言处理引擎),智拓人工智能技术平台(数据分析训练模型),安拓知识图谱平台(数据图谱化、可视化)。基于通用技术平台,公司也开发了系列行业人工智能产品,包括数家资讯大数据平台,数星智能风控平台,网察-舆情大数据分析平台(基于态势感知的新一代网络舆情分析产品),金融风险监测平台,开源情报分析平台等。
2、平台合作
目前,百度网易、360、小米、腾讯均已表态研发chatgpt相关产品。今日收盘后腾讯发布了相关公告。
而早在2022年8月10日,腾讯就已经与其开始这方面的合作:拓尔思信息技术股份有限公司(以下简称“拓尔思”)与腾讯云计算(北京)有限责任公司(以下简称“腾讯云”)在北京腾讯总部签署战略合作协议。双方将发挥各自在云计算、大数据、人工智能和行业服务的能力优势,共同推动产业互联网健康高质量发展。依托拓尔思国内领先的大数据+语义智能技术开展AI产业的合作。
与微软合作的海天已经上涨两倍,传闻与百度合作的慧博云通今日涨停(已发公告澄清传闻不实)而真正与国内巨头腾讯合作的拓尔思呢?
同时公司也与华为有着紧密合作关系:拓尔思自主研发的TRS海云集约化智能门户平台(简称“TRS海云”)通过华为技术认证,并正式成为“华为鲲鹏展翅计划伙伴”,与华为携手发布“华为&拓尔思海云集约化智能门户平台解决方案”。
3、自主可控
从国家战略角度考虑,中美竞争中绝不容许落后的AI“军备竞赛”。对中国半导体,美国已经联合西方从各方面进行了制裁。而这次的人工智能技术的大爆发,也一定会引发两国从商业到国家战略层面的激烈竞争,对于chatgpt的核心技术绝对封锁,所以在这个极有可能影响未来科技发展的技术领域,自主可控是必要条件。公司TRS系列产品已经被国内外4,000多家企业级用户采用,覆盖了众多国家部委和省级政府部门、国家涉密单位、国内主要新闻媒体、大型企业集团等。
还有一点要强调的是,从前天开始,已有数个平台被查封。具体原因大家都懂。所以背靠ZF也是公司的优势所在。
第一次发文,还请各位多多指正!