《进化:构建基因产业的基础设施(32页).pdf》由会员分享,可在线阅读,更多相关《进化:构建基因产业的基础设施(32页).pdf(32页珍藏版)》请在三个皮匠报告上搜索。
1、金鑫 华大基因 研发中心副总监进化:构建基因产业的基础设施01进化:生命的永恒主题02拥抱:生命大数据时代03构建:基因产业基础设施04未来:从读到写的新生目 录content进化:生命的永恒主题进化:生命的永恒主题进化:生命的永恒主题进化:生命的永恒主题拥抱:生命大数据时代拥抱:生命大数据时代拥抱:生命大数据时代Michael Eisenstein,Big data:The power of petabytes.Nature 527,S2S4(11.05,2015)拥抱:生命大数据时代未来15年,华大的数据量会爆炸式增长00500600700华大未来数据量预测PB拥抱:
2、生命大数据时代构建:基因产业基础设施构建:基因产业基础设施自主知识产权,掌握核心科技构建:基因产业基础设施全世界只有两个国家、三家公司,可以量产临床级别的测序仪构建:基因产业基础设施上百台BGISEQ-500列装,强大的数据产出能力用于基因数据计算的硬件1971年CPU1998年现代GPU2005年双核CPU2011年APU(CPU+GPU)2014年DRAGEN2006年CUDA1985年FPGA2016年可编程量子计算机构建:基因产业基础设施用于基因数据存储的硬件1952年磁带1972年LD光盘诞生1982年CD光盘(700M)2006年蓝光光盘(50G)1996年DVD光盘(8.5G)1
3、980年3.5英寸软盘1959年硬盘诞生(5M)1984年3.5英寸硬盘1962年14英寸硬盘(100M)1980年8英寸硬盘(30M)1992年1.8英寸硬盘2003年0.85英寸硬盘2007年固态硬盘(120G)2013年机械硬盘容量达4TB2016年DNA存储获得突破构建:基因产业基础设施每GB的存储成本将要超过测序成本Monya Baker.Next-generation sequencing:adjusting to data overload.Nature method.2010.7构建:基因产业基础设施从硬盘到云存储RAID磁盘阵列硬盘数据中心构建:基因产业基础设施云存储Appl
4、icationsGenome DataPublic CloudLocal CenterOn-premise构建:基因产业基础设施BGI Online:华大的基因云计算实践21时47分12秒StartEnd构建:基因产业基础设施21小时达成千人基因组分析构建:基因产业基础设施新版BGI Online与生命之树存热、冷数据存储切换云端计费的优化管云端计算、存储资源的管理数据、工具、流程的权限管理项目的协作传专线、硬盘、公网传输方案多种上传方式算云端计算调度系统并行计算调度模式升级5个功能模块,新增1个升级28个功能点,新增6个构建:基因产业基础设施新版Online功能升级与新特性未来:从读到写的新
5、生测序成本 sequencing cost 合成成本 synthesis costcost per base pair(log value)单碱基成(对数值)华大未来5年0.05元/碱基Cost in 5 years0.05 RMB/bp 华大未来10年0.01元/碱基Cost in 10 years0.01 RMB/bp 未来:从读到写的新生单碱基测序与合成成本变化趋势未来:从读到写的新生SZ Index:属于未来的黄金指数DNA存储获重大进展George M.Church et al,Next-Generation Digital Information Storage in DNA.Science 16 Aug 2012.http:/