星环科技成功在上海举办年度技术峰会,发布了产品升级至AI Info的策略。星环科技注重从大数据基础
平台到人工智能领域的转变,尤其强调自主研发的大规模通用模型——无涯,在金融领域展现出了强劲
的能力。公司将推出基于云原生操作系统的AI Info平台,包括知识存储与服务平台、语料开发与知识构
建模块、以及大模型基础服务,以推进AI技术的应用和生态系统的建设。此外,星环科技与Art
C及Intel建立了战略合作伙伴关系,共同开发适用于Intel芯片的新软件,并计划在搭载Intel芯片的电脑
上预装Art C软件,以提升计算机性能并吸引更多用户。公司还计划继续增加研发投入,特别是在AI相关
应用和产品迭代上,并通过优化后台部门来控制成本和提高效率,预计全年收入增长约30%,显示出
对AI技术深入应用和未来发展的积极态度。
章节速览
● 00:00 星环科技发布AI Info产品升级与无涯大模型
星环科技在上海成功举办了年度技术峰会,并由公司创始人发布产品升级至AI Info的策略。新产品聚焦
于从大数据基础平台到人工智能领域的转变,其中重点介绍了自主研发的大规模通用模型——无涯,该
模型已获得工信部AIGC备案,并在金融领域展现出强大能力。此外,星环科技还将在上半年完成一项
重要金融大模型项目,彰显公司在人工智能技术及应用方面的实力与进展。
● 02:53 星环推出AI Info: 构建知识存储与服务平台
新环公司推出了AI Info,旨在通过提升原有产品的AI支持能力,建立一个全面的知识平台。该平台基于
云原生操作系统,包括三个主要模块:知识存储与服务平台,提供了向量数据库、图数据库和分析型数
据库等工具以支撑数据存储和计算需求;语料开发与知识构建模块,通过自动化和半自动化的工具优化
数据治理和模型训练过程;以及大模型基础服务,依托于通用大模型和端到端模型训练工具,实现模型
的微调和优化。新环的这一系列举措标志着公司在推动AI技术应用和生态系统建设上的最新进展。
● 08:46 无涯问题:问答系统的革新与金融、工程领域的应用
无涯问题是一个开放公测的问答系统,包含通用问题功能且对表格数据的处理精准度高。此外,即将上
线的无量论述将实现自然语言理解和SQL命令转换,简化数据提取流程。公司还专注于金融和工程领域
的知识积累,提供针对大B及C端客户的云服务,旨在降低数据使用门槛并增强用户体验。
● 13:09 Art C与Intel战略合作推出增强本地算力的AI解决方案
Art C和Intel宣布了一项长期战略合作伙伴关系,共同开发适应Intel芯片的新软件。两家公司通过建立联
合实验室,在Intel发布新芯片时进行软件适配和研发合作。此外,Art C与戴尔、惠普、宏基和联想等多
家搭载Intel芯片的电脑制造商进行了合作,计划在2023年第四季度推出搭载最新技术和预装Art C软件的电脑。此举旨在利用本地AIPC算力提升计算机性能,并通过与Art C的集成吸引更多的B端和C端用户了
解并使用其无界大模型及单机版向量数据库。未来,随着用户需求的增长,可通过订阅模式访问云端的
更大规模模型和数据库,同时,针对企业市场,提供私有化部署方案以满足数据不出场的要求。
● 18:54 探讨AI相关产品订单及营收情况与客户管理策略
讨论包括公司目前的客户基础、复购周期、AI产品应用及其带来的业绩增长。重点关注未来的市场拓展
策略,尤其是在大数据模型和AI技术方面的投入与应用,以及如何提高客户满意度和订单转化率。
● 26:43 企业年度收入分析:软件业务占比提升
公司在过去两年的年报中,软件业务成为收入的主要来源,其中大数据云基础平台软件业务、数据开发
与智能分析工具、分布式关系型数据库分别占据了总营收的38%、17%和11%。与此同时,技术支持服务
和应用与解决方案业务也贡献了一定比例的收入。软件业务收入的增长及毛利的大幅提升反映了公司对
软件业务发展方向的重视以及在市场中的竞争优势。此外,公司计划进一步提高软件收入的比例,推动
整体业务的持续增长。
● 33:05 AI改造数据库与产品升级
公司已开始利用AI技术进行全面产品升级,包括开发AI原生应用及部署大模型,预期全年收入增长
约30%。
● 38:58 公司年度研发投入及人员规划
公司今年将继续在AI相关应用和产品迭代上投入研发资源,并保持研发人员数量的适度增长,计划通
过7-8月的校招补充约50名新员工至研发部门。同时,公司决定不在销售端进行大规模扩编,而是聚焦
于医疗等领域,并在政府行业中加大投入与业务拓展。此外,公司已实现后台部门的优化,致力于成本
控制和效率提升,预计今年的整体亏损将显著收窄。
● 43:43 大数据平台升级与AI技术应用
本次讨论重点在于大数据平台的技术演进及其在AI技术方面的应用。首先,介绍了大数据平台从传统模
式向云平台的迁移趋势,强调了国内用户对大数据平台性能、数据类型处理能力和高频处理效率的需求
远高于国际水平。特别提到了一家公司(新环科技)在大数据平台代码优化和自研率提升方面取得的成
绩,其自主研发的大数据平台在TPC-DS测试中表现出色,成绩领先全球。进一步说明了该公司的大数
据平台如何通过湖仓一体化设计减少数据冗余,提升性能和时效性,并具备强大的数据实时接入、分布
式事务处理和快速统计分析等功能。此外,提出了公司将全面转向AI info战略,致力于将AI技术融入所
有产品和服务中,包括底座的大数据平台和数据库,以及提供易于使用的AI大模型工具,从而增强数据
应用的深度和广度,促进数据底座的扩展和深化。最终,强调了公司对于未来技术发展和客户需求变化
的积极应对策略,呼吁更多关注和支持。
问答回顾
发言人 问:星环科技最近的产品和技术更新有哪些关键内容?
发言人 答:星环科技在其年度技术分会上宣布了今年的整体产品升级策略,将原有“Data Info”升级至“AI
Info”。此次升级主要包括三个方面:一是基于阿里云原生操作系统构建的知识平台——TKH transfer to
knowledge hub,该平台包含云原生操作系统、向量数据库(单机版和分布式)、图数据库CADB、分析
型数据库RODB以及高效文件系统等组件,构成了一个知识存储与服务平台。二是自主研发的自动化和半自动化的语料开发与知识构建工具,帮助客户提升数据治理效率和数据质量。三是升级后的大模型基
础服务,其中包含了无涯通用大模型以及自然语言理解和端到端模型训练工具LM soft sopha,旨在帮助
客户更好地管理和微调自己的知识库及大模型。
发言人 问:星环科技的新款产品AI Info如何满足AI生态中的需求?
发言人 答:AI Info作为全新升级的产品,设计初衷是为了支持整个AI生态的产品技术和实践。它整合了
多种先进技术,例如知识存储与服务平台(包括国内领先的向量数据库、图数据库及强关系型数据
库)和一套语料开发与知识构建工具链。这些模块共同构成了AI Info的核心底座,使得用户能够在AI平
台上高效地存储、计算和管理各类数据与知识,进而实现对大模型的精细化管理、语料优化治理,并充
分利用星环科技强大的通用大模型无涯进行模型微调。此外,AI Info的应用层基于无限大模型展开,涵
盖了AI开发和应用的多个阶段,提供了一整套端到端的解决方案,助力企业在AI领域取得更高质量和效
率的优势。
发言人 问:无限大模型的三个主要应用场景是什么?
发言人 答:无限大模型的应用主要包括无涯问题、无涯问数以及无忧金融和无压工程四个部分。无涯
问题是一个问答系统,具备对通用问题的高精度理解和解答能力;无涯问数则专注于通过自然语言理解
和转化为SQL查询命令,帮助用户快速高效地从数据库中提取所需数据并生成BI报告,降低了业务人员
获取和分析数据的技术门槛。无忧金融和无压工程分别针对金融行业,整合相关法律法规、财经资讯等
内容进行问答,以及面向制造业客户提供知识库项目服务。
发言人 问:无限大模型如何利用云端服务改善用户体验并实现多模态切换?
发言人 答:无限大模型将整理好的知识资源构建成了一个云端的知识平台,不仅面向大型企业B端
提供服务,同时也对to B和to C的客户开放测试使用,且在线端是免费的。为了减轻客户算力
负担,新环(Art C)与英特尔建立了长期战略合作关系,在其电脑上预装新环的产品,例如搭载最
新IIGPU加MPU的AIPC本地算力的电脑等。用户可直接在本地计算机上利用新环提供的本地算力执行模
型训练任务,甚至实现类似微软Copilot的功能。当本地计算能力不足时,用户可通过一键切换至云端服
务,享受千亿参数大模型及向量数据库的强大性能,并采用订阅模式进行收费。未来随着技术发展,企
业端仍可能选择私有化部署方式,但无论是云端还是本地部署,都能便捷地实现知识平台的一键切
换,充分利用局域网算力或云端资源。
发言人 问:年报显示我们有大约500多家签约客户,那么实际累积的客户数量是多少?此外,您能分享
一下关于新客户的获取及发展方向吗?我们的定价机制是如何设定的?以及客户升级至AI产品后,整体
签约金额会有怎样的变化趋势?
发言人 答:年报提到的500多家签约客户实际上是近两三年的签约量,而由于复购周期的存在,预计累
积的客户数量可能达到1500到1600家。我们将优先推广给现有存量客户,并利用原有TDH升级作为拓展
新客户的契机,同时考虑客户不同采购渠道的需求进行升级或扩容。我们的报价基于客户知识库或大模
型所需包含内容的广度,基准价格为100万元人民币,后续还会根据客户需求添加额外费用。预计单个
客户签约金额在三四百万元左右建立一个基础的知识库。从年报数据分析来看,今年截止到6月底,大
金额合同(300万以上)的数量将持续增长,这表明客户签约金额总体呈上升趋势。
发言人 问:目前AI相关产品的订单情况如何?尤其是已经确认的营收情况能否透露一些?
发言人 答:尽管我们不便在此公布具体AI订单数据,但从1月份公开投票的数据来看,截至去年年底的
合同额超过五千万元。预期到6月底,整体合同签单额的增长将比上年同期增长约35%。发言人 问:能否分享一些AI应用在各行业的代表性案例?比如金融监管方面有哪些实践?
发言人 答:在金融监管领域,我们帮助证监会实现了合规核查功能,将法律法规整理及内部指引等内
容放入大模型中。另外,在与某国有银行的合作中,我们运用大模型为其小微企业贷款申请审查提供支
持,显著减轻了人工审查的工作负担。
发言人 问:公司在二三年年报中的主要业务收入板块是如何构成的?
发言人 答:公司二三年年报的业务收入主要由基础软件业务和应用与解决方案两大部分组成。基础软
件业务主要包括大数据云基础平台软件、数据开发与智能分析工具(含AI Info)以及分布式关系型数据
库,分别占据了收入的38%、17%和11%,总和近3.25亿。此外,与这三款软件相关的技术支持服务占总
收入约15%,不到1亿。而应用与解决方案则聚焦于帮助客户制定数据应用与解决方案的规划,并将基础
软件与咨询服务相结合,从而促进软件销售。
发言人 问:公司在软件收入提升方面有哪些策略和成效?
发言人 答:公司一直在努力提高软件收入占比,并且综合毛利已从2022年的约50%增长至超过60%,这
主要归功于软件收入占比的逐步提高以及软件成熟度和标准化水平的增强。随着软件功能的优化和普
及,客户对技术支持服务的需求减少,使得公司能更多地依赖软件本身实现销售收入,从而推动了综合
毛利率的大幅提升。
发言人 问:一季度收入增长趋势如何?毛利为何较高?
发言人 答:一季度保持高速增长态势,综合毛利率约为70%,主要原因是收入结构发生变化,特别是软
件许可授权业务的贡献显著提高,其单项毛利通常在95%以上。同时,技术服务综合毛利有所下降,而
应用解决方案业务则因人员成本上升初期亏损较大,但在去年有所好转并接近盈亏平衡状态。总体来
看,公司综合毛利的增长得益于软件许可授权业务和其他业务收入结构的变化。
发言人 问:我们基于大模型的数据能力和AI原生应用(如问知问数)在行业中如何与其他类似产
品(如Kimi和密塔AI)竞争?
发言人 答:我们的竞争优势在于对数据的解析能力强,拥有自研的IA级技术实现精准问答,并且支持多
种数据模式(图片、音频、视频等)。此外,我们的模型搭载了分布式向量数据库Hypo,能处理各种
格式文件的自动入库。目前公测时,CQL的精确度达到了80%,这在所有公开大模型中是最高水平。
发言人 问:一季度营收增速较高,全年展望能否介绍一下?
发言人 答:预计全年的收入展望大约在30%左右,这一展望并未有显著变化。
发言人 问:今年的费用支出情况如何?特别是在研发方面以及是否会有大规模扩充?
发言人 答:在研发方面,我们将进行校招补充研发部门,规模可能略有减少但仍将继续招聘高质量人
才。销售端不会大规模扩充,但会加强对医疗领域的投入,尤其是在政府行业业务拓展上取得了显著成
果,计划进一步扩大市场份额。
发言人 问:对于大数据平台由Hadoop升级至云平台的现象,你们是否有相应的升级计划?
发言人 答:我们暂未提供明确答复,因为该问题涉及的具体技术和市场环境信息需要详细调研才能给
出明确的回答。发言人 问:中国客户对于大数据平台性能及数据处理能力有何特别需求?新环的大数据平台相较于海
外竞品有何独特优势?
发言人 答:中国的客户对大数据平台的需求相比国外更高,体现在对性能、能处理的数据类型种类及
高频处理功效等方面的要求更为严格。因此,新环自成立以来一直在不断提升其大数据平台的自研
率,并通过代码改造和升级实现了显著的进步。新环的大数据平台,在TPCDS测试中表现出色,取得全
球性能第一的成绩。该平台采用“湖仓集一体”的设计,即把数据库与仓库数据集中存放,只需存储一份
数据,避免了冗余存储带来的高资源占用和一致性维护难题。此外,新环的大数据平台还具备实时数据
接入追踪、分布式事务处理、快速统计分析等关键性能特性,能做到行存列存并行进行,保证高并发且
保持分布式事务数据的一致性,这是海外同类竞品尚未实现的功能。
发言人 问:星环未来的发展战略是什么?
发言人 答:新环计划全面转向AI info领域,将AI技术应用于公司的基础架构、数据底座、大数据平台以
及数据库等多个层面,确保其产品和服务都能支持AI性能提升。公司将努力优化AI大模型工具层的易用
性和便捷性,鼓励客户深入挖掘和利用数据,从而增强对底层数据底座的依赖性,推动底层业务拓
展,最终实现对数据应用的持续增加和数据底座商业价值的反哺。