一、向量数据库
孙元浩说,数据处理从多模型向多模态转型,从单一模态向多模态进化,企业数据分析来到新的次元。
为了适应这一全新转变,星环科技推出了自研的向量数据库,拓展大语言模型时间和空间维度。使用星环科技的向量数据库+分布式图数据库,可以构建基于大模型的应用,让每个人都拥有自己个性化的AI助理。
向量数据库由于与AI大模型的协同作用而以惊人的速度流行起来。最古老的数据库类型是SQL或关系数据库,其中所有的数据都结构化的。Web 2.0公司不断增长的需求引发了NoSQL革命,数据库变得更加灵活,出现了能够处理更多非结构化数据的数据库,能够的处理数量更加庞大。现在,随着市场对人工智能应用的追捧,出现了另一种被称为向量数据库(vector databases)的新市场。AIGC热更是将加速了向量数据库的投资热。
在本次峰会上,星环科技推出自研的向量数据库Transwarp Hippo。作为一款企业级云原生分布式向量数据库,星环Hippo支持存储、索引以及管理海量的向量式数据集,能够高效地解决向量相似度检索以及高密度向量聚类等问题。
与开源的向量数据库不同,Hippo具备高可用、高性能、易拓展等特点,支持多种向量搜索索引,支持数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,能够很好地满足企业针对海量向量数据的高实时性查询、检索、召回等场景。
二、金融大模型无涯
一是服务于金融行业的星环金融大模型无涯。星环科技长期深耕金融领域,服务大量金融行业客户,积累了上百万金融专业领域的语料;基于星环科技对图数据库、深度图推理算法的技术,形成了大规模高质量的金融类事件训练指令集。二者共同铸就了星环科技开发金融领域大语言模型的坚实底座。
无涯是一款面向金融量化领域、超大规模参数量的生成式大语言模型。无涯使用上百万的专业金融语料,其中涵盖了研报、公告,政策,新闻等高质量的自然语言文本来作为基础大模型的二次预训练语料,使得无涯具备对包括基本面、技术面、消息面在内的金融通识领域准确的理解能力。
无涯构建了包括政策、舆情、ESG、风险、量价、产业链等六类大模型基础因子集,擅长处理金融量化领域的各类问题,诸如在政策和研报分析、新闻解读、事件总结和演绎推理上都具备强大的理解和生成能力;能够对股票、债券、基金、商品等各类市场事件进行全面的复盘、传播和推演;能够生成另类的策略因子集合,构建立体的归因解释体系。无涯大模型通过多模感知+事件驱动+深度图计算,从时间和空间、深度和广度等多个方面扩展投资研究的视角,实现了全新的智能量化投研新范式。