目前贝瑞基因年产出的基因数据量已超过PB级,并且在标准/结构化数据及人工智能数据算法、对临床信息解读等方面的优势日益凸显。贝瑞基因汇聚了一批国内外资深的生物信息分析和大数据挖掘等跨领域专家,坚持以满足市场需求为目标,提供一系列创新性解决方案,这些算法和技术不断地被应用在产品和服务中,进一步巩固了贝瑞基因在行业中的竞争力。
在大数据挖掘方面,贝瑞基因不仅拥有PB级别的临床级基因数据,还拥有一大批具有计算机学、基因组学、遗传学等多学科背景的高端人才和海量数据处理能力。凭借这些优势,贝瑞基因深入挖掘出一批高质量核酸变异位点(SNV/SNP)、插入缺失片段(InDel)和拷贝数变异(CNV),揭示了一系列遗传突变规律,为重大疾病的预测、诊断和治疗奠定重要基础。截至2019年7月,贝瑞基因已积累并成功挖掘300万人群大数据的变异图谱,包括百万健康人群CNV大数据,百万健康人群SNP/InDel大数据,5万患者人群CNV大数据,10万人群WES大数据。目前公司在百万级人群变异图谱挖掘的基础上,正进一步进行基因型-表型大数据挖掘工作。
AI算法开发是大数据处理过程的一个重要环节,其主要难点包括自然语言处理、深度神经网络、知识图谱等技术,贝瑞基因对其深入研究,自主研发了NLPearl遗传疾病人工智能临床决策支持系统,将百万人群基因大数据与人工智能技术相结合,对任意口语化的临床表型进行推断分析,准确率达90%以上。
NLPearl系统采用深度神经网络技术,结合患者临床表型和Enliven系统提供的变异位点注释信息,并采用知识推理技术,提示患者表型和基因型关系,对变异在不同个体上可能产生的影响进行合理评估。从而为科研和临床工作者提供决策支持和全方位的整体解决方案。