洛阳吉恩特生物科技有限公司

新闻中心
联系我们
洛阳吉恩特生物科技有限公司

联 系 人:吉恩特客服
手  机:136-0866-9917(微信同号)
地  址:河南省洛阳市高新区火炬创业园

行业动态
当前位置:首页 | 新闻中心 > 行业动态

如何搭建完整的“基因测序数据分析平台”

作者: 发布时间:2018-09-19 浏览次数:987
打印 收藏 关闭
字体【
视力保护色

毋庸置疑,随着下一代测序(NGS)技术的迅猛发展,其在癌症、遗传病基因检测等领域的应用不断拓展与普及,基因测序数据正在以***的速度在增长!面对与日俱增的海量基因数据,对其进行分析与解读是摆在当前的一项巨大挑战。

一个完整的基因检测过程,主要涉及以下步骤:

 1 DNA提取、建库测序;

2 初级生物信息分析获取变异信息、***信息生物分析获取关联数据;

3 ***终生成客户能够简明易了的检测报告。

其中,步骤1有大量的实验供应商可以找寻;但是技术含量更高的步骤2和步骤3,一站式的解决方案提供商,相对较为稀缺,也是介入基因检测行业后,能否取得很好的市场口碑形成良好市场效应的关键。

无论是国内,还是国外,都还没有统一的生物数据分析平台,基因数据分析仍是基因检测的核心关键,是NGS的一个重要组成部分。从原始测序结果中找到致病突变,SNP、Indels、融合、扩增等,是完成疾病的预测、诊断以及治疗策略制定的重要依据。

先前市场上所提供的数据分析工具,功能比较单一,适用范围较窄。一个工具可能被用于校准比对(alignment),另一个工具可能被用于变异注释,比如不同的注释软件有Annovar、SnpEff、VEP、Oncotator、选择合适的软件注释variants对于下游分析很关键。所以,针对复杂的基因数据分析服务,不具备***生物信息分析技术团队的公司或实验室,都难以开展完整的基因检测业务,这导致很多机构把这部分流程外包出去。

接下来,我们以23GENEBANK公司所开发的专用于测序数据分析的GIAS(GeneBank Genomics dataIntegrated Analysis System)平台为例,剖析该平台的特性及应用。GIAS平台包含了该公司在基因检测方面多年开发成果,实现从原始测序数据分析到PDF报告的简易流程化操作,可大大降低人员培训的时间和资金成本。

23GENEBANK 负责人蔡女士介绍,和市售同类产品相比,GIAS有着众多优势,包括:高可移植性、多重技术平台支持、一键式生成报告、临床/零售双场景等,其中临床/零售双场景是GIAS独有优势,融合了公司的健康线和临床线产品内容。GIAS平台不仅拥有市场***的消费类基因检测项目,可分析健康类项目接近7000项,同时也能进行临床肿瘤治疗中化疗用药、靶向用药、免疫药物的分析。因此,想要进军基因检测市场的企业可以根据自身市场定位和应用场景,提出不同的需求,23GENEBANK会根据具体需求提供定制化模块,***终呈现一套完整E2E产品开发方案。

此外,根据GIAS平台工程师Victor Wang的介绍,开发团队采用了Docker容器,帮助解决了很多用户的实际问题,无论是选择GIAS一体机,还是使用已有的服务器、各类云平台,都可以部署分析流程。

相比于2017年7月在"第三届精准医疗与基因测序"大会上推出的初代版本,开发团队遵照Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines(NGS生物信息流程验证标准和指南),将GIAS平台进行了升级优化,利用4个技术优势,实现平台的***使用,尤其是分析时间大幅缩减至原有的1/10。

1.整合生信工具,关联大型KDB数据库

GIAS平台综合利用各大数据库的注释信息,可对海量变异进行自动化筛选,并定期更新。涉及数据库包括NCBI dbSNP、1000Genomes、OMIM、PharmGKB、Cosmic 等各大权威数据库。该平台整合了疾病、药物、特质、变异位点、结构变异等海量***度信息,对存储信息进行了校正、去冗余、升级和规范化处理,并按照ACMG标准进行权重分级,为变异解读提供了有临床意义注释信息。

2.ALL in one

Union file system:将不同层整合成一个文件系统,并为其提供了统一视角,在优化多层存在的同时,使用户角度仅存在一个文件系统。在GIAS数据流系统里,一个作业会被分解成一系列互相依赖的任务,Centralized scheduler负责监控整个作业的进度以及整个系统资源的使用状况,方便部署集群计算机网络,提高了复用率和***大可移植性。

3.多线程任务优化

GIAS充分利用硬件系统的计算性能,在多个主要数据分析算法中应用了多线程并行计算(multithreading),在计算量和数据量多方面分化并行处理,从而实现对CPU和RAM的充分自适应利用,加速分析时间,只需原有分析时间的1/10。

4.图形界面,操作简便

GIAS平台采用AIO全图形界面操作,一体式的基因检测分析系统,能够满足客户的硬件配置和软件安装需求,实现开机即用。该平台的基本开发配置是基于CentOS 7服务器系统,采用了Intel Xeon平台、ECC自纠错内存、RAID 独立冗余磁盘阵列存储系统。目前只需要一个运营操作人员,即可顺利操作该系统,傻瓜式操作,是23GENEBANK系统开发团队倾心倾力的结果。

在基因检测这个细分领域,数据分析是重中之重。首先,从功能层面上来说,平台产品需要满足“可定制、可视化操作、全自动报告生成”的基本需求;其次,从知识库建库来说,无论是临床、科学研究,还是消费级基因检测,如何从海量的变异信息中抽丝剥茧,寻找真正有意义的致病突变是一个难题,因此完整的知识库是平台建设的基础。再者,从数据库更新来说,科研要抓取前沿研究,用户选择的平台需要是一个长期且需要不断维护的数据分析平台。

洛阳吉恩特生物科技有限公司
联系人:吉恩特客服
手机:136-0866-9917(微信同号)
地址:河南省洛阳市高新区火炬创业园

版权所有:洛阳吉恩特生物科技有限公司 备案号:豫ICP备15029662号-1 流量统计:
logo 0379-6023 0863