2017年5月 ,19岁的的世界围棋第有一有一个人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,与此同时 是人类自身顶尖高手与这台机器间对于还是 一一两次较量 ,同年10月 《Nature》杂志发表了达近它所有方式比较在之前版本的AlphaGo Zero。和一佳绩向的世界展示了近一步建立系统提供源自学大获完成复杂其他任务更最让人然而性 ,而其背后所代表的世界更最让人运算能力全面 ,是计算机科学的分支领域发展--高性能计算(High Performance Computing) ,只更最让人际应用与此同时它它成国家中综合整体实力的体现 ,更给大家的日常这样带来冲击来冲击了可以的新变化 ,当前该新型技术已在航空航天、核试验模拟、天气预报、生命延续科学、高新制造(汽车、微电子)等领域发展佳绩了广泛应用。
以生命延续科学领域发展举例 ,逐渐被 被 生命延续遗传密码(基因组)的逐渐被 破解 ,人的生老病死和一复杂做做的事真正地用数字化的经一具体地呈现 ,以期大获完成疾病的精准分析结论、诊断和治疗效果 ,让大家远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病 ,全面提高 人均预期寿命 ,并大幅度全面提高 社会需要卫生总负担。
近二十年来 ,有一有一个人全基因组测序的成本以“超摩尔定律”的速度一般下降 ,而高性能计算在测序数据统计 分析结论主方向的应用也发生过了翻天覆地的可以的新变化 。当前的世界主流的基因组测序数据统计 分析结论工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit) ,该项生命延续科学领域发展公认的最佳我的工作流程大获完成三有一有一个人全基因组(Whole Genome Sequencing ,WGS)30X数据统计 分析结论真正地1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算领域发展首获突破性进展 ,于近日大获大获完成6分钟大获完成30X WGS全流程的分析结论其他任务 ,相较于GATK新标准 计算时长提速300倍。
根据上述NIH公布的最新资料 ,逐渐被 被 测序新型技术的发展方面 ,测序成本以超摩尔定律下
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data
6分钟大获完成30X WGS其他任务是由华大基因自主研发的LUSH工具集大获完成的 ,打破了该各种软件在2020年1月创造的15分钟极限速度一般。中是是黑科技恰是采用先进了全的新底层架构独特采用先进 ,提供全面了此基础中央处理完成器和图形处理完成器相相结合实施基因数据统计 分析结论的高性能速度一般方案 ,在全面提高 集群计算资源消耗、全面提高 检出速度一般的与此同时 ,大获完成了全程自动化、完整信息 化 ,有记录可回溯 ,真正地更稳定地用于精准医学的应用场景。
LUSH工具集速度一般的的新底层架构逻辑
LUSH工具集提供全面和两种“CPU+GPU”的高并行软硬件解决好方案 ,此基础经典流程中是各种软件模块BWA、SAMTOOLS和GATK ,经一GPU的通用运算新型技术 ,实施计算引擎和速度一般引擎的的新架构独特采用先进 ,大获完成算法优化和并行化处理完成 ,并相结合华大自主研发的超高通量测序仪 ,大获完成碱基数据统计 流的超高速分析结论 ,还是 首获准确的分析结论还是 。
LUSH工具集速度一般流程示意图
恰是只更最让人生命延续数字化进程真正地严谨的科学个人精神 ,而其应用场景主要包括体以前精准医疗、健康管理等与人类自身健康却有息息有关的领域发展 ,是然而不同人于除此除此以外 高性能计算领域发展 ,基因组数据统计 分析结论对精度有极高的根据上述要求 。而只更最让人高性能和准确性并才可完完全全兼得 ,数据统计 覆盖范围、分布和浮点精度、峰值性能和内存也会产生影响算法的再选择 ,对于涉及到最好的最优解和近似解的算法是然而大相径庭。LUSH工具集恰是实施在经典流程算法的此基础上经一了其的新独特采用先进的底层架构近一步减小了前面还是 的读写 ,并经一CPU大获完成基因分析结论其他任务的智能分发 ,经一GPU数千计算核心大获完成百万其他任务的极速并行处理完成 ,与此同时解决好了经典流程计算密度较高、频繁地存储器访问等解决好 ,经一测试其新标准 品的准确性还是 与经典流程一致 ,达近99.86% ,然而其真正地在计算还是 的准确性与极速性上得以平衡。
更优越的性能、更低的成本和更高效的检出是所有方式比较高性能计算应用领域发展的研发追求一个目标。对速度一般组件的持续的研发源自对速度一般无止境的追求 ,正如新手机芯片行业发展的发展方面 是逐渐被 被 移动端消费需求的旺盛 ,新型技术才得以逐渐被 地迭代和进步。从基因组学此基础专门研究 到临床专门研究 及应用 ,大获完成测序工具的自主可控的与此同时也真正地大获完成数学方式比较之上自主研发 ,而不只更最让人追求芯片的底层下潜开发。对后者是无止境的追求 ,而才可才可前者的完完全全可控才可大获完成从跟随模仿到才可才可超越更最让人然而 ,从核心算法的研发上助力欧美国家 精准医疗自主可控的发展方面 进程。