登录注册
3分钟搞懂向量数据库
夜长梦山
2023-05-07 20:19:01
全市场最前瞻: 3分钟搞懂向量数据库,含空间定量测算!【天风计算机 缪欣君团队】 AI最前瞻、最深度、最持续,从海天到三大应用到盘古再到向量,系列二十余场电话会议助您持续把握投资机会! 1、什么是向量数据库 Vector database(向量数据库)专门用于存储、索引和查询#非结构化# 数据生成的嵌入向量,可以用来解决向量的存储、检索和分析问题。 与之前的关系型数据库或者其他非结构化数据库不同的是,向量数据库主要采用#相似度索引#,通过计算两个向量之间的相似程度返回查询结果。 2、为什么向量数据库是大模型刚需 向量数据库在大语言模型时代之前,使用场景主要在非结构化数据(文字/图片/音频/视频等)相关的查询和检索,例如以图搜图、文本检索等,互联网公司中主要应用在“搜广推”业务,可以显著#降低成本# 和工程难度。 大模型时代向量数据库迎来了大的产业拐点,可以成为大模型这一“大脑”的记忆能力来源,当大语言模型在复杂问题处理(类似AutoGPT)时,需要多步骤完成解答,此时就需要向量数据库; 当应用大模型的场景需要与外部数据结合时,例如结合外部搜索或者企业私有数据,也需要用到向量数据库,结合外部数据是to B大模型应用的重要一环;在简单的问答场景,使用向量数据库也可以减少对大模型API的调用次数,例如GPTChche项目。简而言之,向量数据库是大模型时代应用的标配之一。 3、定量测算向量数据库长期空间 现在向量数据库市场仍处于早期,商业模式没有完全明朗,简单可以分为KA定制和云数据库模式(按照存储和计算资源收费) 以Pinecone为例,存储量每个月#每 GB 定价# 在 0.025美元#,而计算使用量则是每小时 0.1-1美元不等,根据算力等级有所差异。根据IDC的预测,到2025年,全球非结构化数据的量将达到16.67万EB,假设其中0.1%用向量数据库存储,信息密度5%,仅存储就会带来未来约25亿美金的市场规模,随着非结构化数据应用在大模型的场景不断提升,相信这一市场空间也会快速提升。 4、产业链主要玩家,国内蓄势待发 全球市场上,向量数据库的头部企业包括Zilliz、Pinecone、Weaviate等,其中Zilliz是向量数据库的开拓者,也是目前产品最成熟,性能最强的向量数据库公司。随着大模型应用的拓宽,海外向量数据库公司迎来了融资的井喷期。
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
星环科技
工分
11.05
转发
收藏
投诉
复制链接
分享到微信
有用 12
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据