基因大数据商业化征途:资本抢滩、企业竞相布局

2018-10-17 爱比价妈妈-能让你省钱的网站

高凉说

  记者 唐唯珂 深圳报道

  导读

  “基因大数据,则是我们自身生命体的数据,是生老病死的基础,它影响着我们的日常生活和行为,更多体现的则是真实的自我。”

  随着无创产前筛查等基因检测成本的不断降低,基因大数据商业化进入射程。

  就在本月初,国际顶级学术期刊《Cell》上发表了一篇名为《Genomic Analyses from Non-invasive Prenatal Testing Revel Genetic Associations, Patterns of Viral Infections, and Chinese Population History》的文章,第一作者为华大研究团队研究员刘斯洋。

  该研究发布了迄今为止最大规模的中国人基因组学大数据研究成果。此成果正是基于不断普及的无创产前基因检测,涵盖近些年涉及14余万中国人的检测数据。基因数据对于临床决策支持、疾病预防和管理、新药研发和基础研究等涉及精准医疗的各个方面均有重大意义。

  此次发表的论文揭示包括31个省,汉族与36个少数民族在内的中国人群精细的遗传结构,进行多种表型的全基因组关联研究,揭示中国人群中病毒序列分布特征,构建了包含约900万个多态性位点的炎黄中国人群基因频率数据库 (CMDB)。

  基因大数据序曲

  医疗大数据潮流,不同于简单的互联网数据化,具有生物领域的特殊性。

  其可分为四类,诊疗数据、研发数据、患者数据以及支付和医保数据。其中,基因测序产生的大数据可归属于诊疗和患者数据。

  测序成本的降低给基因大数据研究提供了基石。

  2007年前后,基因测序技术的突破使基因测序成本飞速下降。2017年,Illumina在第35届摩根大通医疗健康年会推出NovaSeq系列测序仪。据Illumina官方称NovaSeq系列测序仪可为从单细胞到人类全基因组的测序提供快速和经济的解决方案,有望将基因测序成本降至100美元。

  全球基因测序公司之间的价格战早已打响,成本降低之后,下半场争夺更多集中在如何实现基因大数据的商业化。

  同样近年来在中国基因检测的普及速度十分迅猛。截至去年年末,国内已有340家医疗机构经批准可开展产前诊断技术服务,足以预计基因测序数据必然迎大幅增加,未来生成的数据必然“浩瀚无垠”。

  华大生命科学研究院院长徐讯对包括21世纪经济报道在内的记者表示,对于出生缺陷的研究、肿瘤、传染病的研究和病毒感染提供基础数据,基因数据本身就能带来巨大的科学发现,同时也是我们能在未来做出巨大产业突破的第一步。

  上游测序设备及成本下降,带来的是下游应用的扩张,尤其是临床检测领域。成本降低使每个人拥有自己的DNA序列信息成为可能。

  另一方面,市场对中游基因数据分析领域的需求激增。储存1个基因组就需要约60Gb的储存空间,大约1000个CPU时间来处理。巨大的基数和其发展现状,决定了未来基因测序的工作重心会从人工测序转到数据分析上,未来基因数据分析的价值很可能会超过测序本身。

  大数据可以帮助我们终结很多疾病,以NIPT为例,通过数据分析可发现孕期肿瘤的踪迹。比对遗传病的分子流行病学数据库,找到BRCA2突变位点的频谱分布,可能实现有效控制肿瘤、癌症的发生。尽管业内科研人士对21世纪经济报道记者直言,基因检测预测癌症在科研领域离实现仍有很长距离,但已经成为攻坚大趋势。同时,大数据也可以帮我们改变体内肠道的菌群生态,规避不健康肥胖。

  国内外巨头竞相卡位

  卡位基因检测大数据平台,成为科技公司和生物公司共同的选择。

  基因检测行业巨头Illumina,今年上半年以1亿美元收购了Edico Genome,Edico Genome的DRAGEN? Bio-IT平台。该平台主要功能即是使得新一代测序数据的分析能力加速。

  该平台利用现场可编程门阵列技术以及专有的软件算法,可减少数据占用空间,并且缩短获得结果所需要的时间。

  此前美国瑞迪儿童基因组医学研究所打破世界纪录,在19.5小时内对一个全基因组进行测序与分析,依赖的就是Illumina的测序仪和DRAGEN数据分析平台。

  中国市场方面,今年年初,Illumina的云计算平台BaseSpace终于在北京落地,该平台可以提供基因数据的存储、管理和分析,帮助企业提高测序能力。

  此外,国内测序龙头华大基因也和阿里云、英特尔进行合作共同推出大规模生物信息分析平台BGI Online,英特尔通过BGI Online为用户免费提供最新版的基因组分析工具箱GATK4的使用授权。过去完成3000份的全基因组数据分析至少需要6个星期,而应用GATK4,在两个星期内就可以同时完成1.5万个全基因组数据的分析。

  以BGI Online为代表的大数据平台,向着基因“应用市场”角色定位出发,搭建平台,为研究机构、药厂和临床实验室等用户提供基因组学的数据和应用。

  用户可以在平台上访问自己的数据,获取标准分析结果,也可以定制个性化的数据分析方案,并与其他授权用户分享数据和成果。而这其中互联网企业和生物医药企业目前形成一定程度的联动。例如,依托部署在阿里云计算平台的服务,BGI Online更轻松地拥有了处理大规模基因组数据分析的能力。

  以英特尔公司为例,在布局基因大数据的路上,除了与华大合作之外,还与上海交通大学、上海市儿童医院,香港大学,诺禾致源,以及荣之联等展开合作。

  2017年6月,英特尔和上海市儿童医院宣布启动儿童健康协作云中心,目的是把儿童遗传基因组研究和数据交换应用于临床。英特尔公司全球副总裁兼中国区总裁杨旭曾称:“2020年要把24小时内完成一个人全基因分析的费用降到500美元。”如今云计算供应商还在大数据处理能力上不断实现突破。

  诸如谷歌亚马逊微软IBM等互联网公司也都纷纷入场,布局基因大数据。

  一般互联网企业的大数据与如今生物医药领域的基因大数据有所不同。

  华大基因BGI Online负责人金鑫对21世纪经济报道记者说道:“普通理解意义上的数据与基因数据的性质是完全不同的。目前互联网公司的大数据更多指的是用户在网络上的行为数据,比如,聊天、购物、游戏等。它们体现的是我们在虚拟世界中的行为投影。而基因大数据,则是我们自身生命体的数据,是生老病死的基础,它影响着我们的日常生活和行为,更多体现的则是真实的自我。相同的地方则在于,无论是互联网上的数据还是我们的基因数据,其实都可以代表我们每一个人,一个代表的是虚拟世界的你,另一个则是真实世界的你。”

  当今基因测序行业面临最大的挑战已不再是基因测序技术,而是处理巨大的数据量以及如何从巨大数据中获取临床指导。生物信息分析服务是目前业界公认的最具发掘潜力以及盈利能力的环节,但目前国内还处于起步阶段。

  在海量测序结果面前,数据深度挖掘和解读方面存在的严峻挑战日益明显。如何在基因大数据时代利用好这些数据资源,已成为生物科研新时代的重要课题。快速积累的数据如何得到高效解读,成为其商业化突破必须化解的难题。同时,大量未解读的数据同时也带来了无限创新的可能。

  “反哺”科研

  徐讯对21世纪经济报道记者表示,在未来应用上,数据集对新的病种开发有很大帮助。原来本身即有经典的癌症基因,均是基于西方人的数据库,中国人发现大量意义未明的突变,无法在西方的数据库检验,完全是因为我们找错了体系。通过这个数据集,进行诊断,参考病情会更加明确。并非直接开发新的数据,而是开发有关基于临床检测新的药物,需要中国人的数据。华大推动此类数据集的建立,对中国的医药健康产业均有巨大价值。

  华大在2016年正式发起“百万人群基因大数据研究”项目,此次发表在《细胞》上的研究项目正是其第一期的成果。涉及14万人的临床数据,针对“百万”的数目实现的日期,华大方面向记者透露有信心在未来三年实现。

  “我们这次的数据,对个体来讲,测得深度并不是很深,这与传统基于人类遗传的研究有所不同。一个人的基因组要测30倍,我们差了将近1000倍的数据量,我们选取的样本数是常规的3万多,这也是解决目前在人类遗传方面的争论,及是个体数据检测的深入,还是群体中选择更多的样本数。此次的研究也证明了覆盖大量的取样同样可以给出非常精确的研究成果。且尺度更宽、更广这也是很重要的亮点,尤其精准医学上是可行的。所有的算法都是我们自己开发的,实现宏观的思路上科学的重大突破。”徐讯补充。

  华大研究员、文章第一作者刘斯洋也向记者指出,此次研究的重点在于建立了一套全新的研究思路和分析算法,突破了当前组学领域难以使用超低深度全基因组测序数据进行遗传学研究的局限和挑战。首次证明了NIPT数据可用于回答多个遗传学以及医学领域重大问题的价值和潜力,该方法和策略可被全球基因组学研究参考与应用。

  放眼全球基因大数据工程,目前进展最快的是英国。2018年10月3日,英国政府宣布将在未来五年内开展五百万人基因组计划,并表示从2019年起,全基因组测序将被作为标准之一辅助重病患儿、患有难治愈或罕见疾病成年患者的治疗。也标志着精准医学研究进入了大数据时代。英国模式具有一定特殊性,其不仅是科学研究,它也是医疗应用。

  “而在此领域中国算得上是同步不是领先,14万人的基础证明了我们另外一个思路,做百万精准医学的产物是可能的。基于我们临床检测过程中,患者、病人自愿参与到科研中,把他们的临床检测数据用于科研。是来自于临床数据的收集,临床数据到科学数据,科学数据又回到临床。中国人的临床研究会做到国际领先水平,我们是有机会的。”徐迅说。

  此外值得一提的是,数据出境的问题越来越受到关注。对比此前发表核心期刊文章,数据必须要传到国际三大数据库,即美国的NCBI,EBI、日本的DDBJ,存在危害我国遗传资源管理的风险。而此次文章数据的内容将由国家基因库自主存储管理。

网友评论
 验证码
 

大家都在看
金融科技反欺诈现场:超6成坏账来自黑中介骗贷

金融科技反欺诈现场:超6成坏账来自黑中介骗贷

记者 陈植 上海报道担任一家金融科技平台风控总监起,赵诚(化名)每天都要与黑中介作斗争。所谓黑中介,最初...

金融科技助个人企业信用清晰 融合各行大数据是基石

金融科技助个人企业信用清晰 融合各行大数据是基石

原标题 金融科技助力个人企业信用更清晰融合不同行业大数据是基石记者 陈植 上海报道导读...

锤子回应解散分公司:整合技术人员

锤子回应解散分公司:整合技术人员

有消息称在获得成都6亿元投资后锤子公司解散分公司锤子回应:整合技术人员昨天,锤子成都分公司解散的消息被传出。一年前,锤子公司在成都注册新公司...

微信朋友圈霸屏锦鲤都靠谱吗?

微信朋友圈霸屏锦鲤都靠谱吗?

武汉大学称“武大锦鲤”为商家促销与学校无关各地“锦鲤”层出不穷警方提示谨防上当近日,一个名叫“武大校友圈”的公众号发布了“寻找武大锦鲤”的抽...

8轮融资17亿 锤子科技还能试错几次?

8轮融资17亿 锤子科技还能试错几次?

记者孟庆建锤子科技,定位于中国智能手机市场上独辟蹊径的“情怀”品牌,在罗永浩的影响下,也拥有不少拥趸者,但始终囿于依靠罗永浩个人影响力营销,...

闲鱼的困惑:买家遭遇交易“陷阱” 维权成本高昂

闲鱼的困惑:买家遭遇交易“陷阱” 维权成本高昂

李甜李静不到10分钟,清华大学运维工程师高英凯向《中国经营报》记者展示的一台苹果笔记本电脑,在未充电的情况下,电量由开机时的26%自动上升至...

格列卫:一个神药的传奇——愿病者有其药

格列卫:一个神药的传奇——愿病者有其药

来源:我是科学家iScientist这两天,徐峥与宁浩共同监制,徐峥亲自主演的一部喜剧电影《我不是药神》刚刚在全国院线正式上映。这部在点映阶...

海尔热水器突然爆炸 3岁女童脸被烫伤构成6级伤残

海尔热水器突然爆炸 3岁女童脸被烫伤构成6级伤残

本文来自法制晚报法制晚报·看法新闻(记者周蔚)母亲在家给三岁女儿洗澡时,海尔热水器突然爆炸,母女俩全身被烫伤,女童面部瘢痕严重构成六级伤残,...

三部委:在交通出行领域开展严重失信行为专项治理

三部委:在交通出行领域开展严重失信行为专项治理

各省、自治区、直辖市社会信用体系建设牵头部门、发展改革委、经信委(工信委)、交通运输厅(局、委)、公安厅(局):为全面贯彻党的十九大和十九届...

空姐乘滴滴遇害嫌犯已锁定 曾微信同事称司机想亲她

空姐乘滴滴遇害嫌犯已锁定 曾微信同事称司机想亲她

澎湃新闻记者彭瑜5月10日,澎湃新闻从知情人士处获悉,郑州警方已锁定“空姐乘坐滴滴顺风车遇害”案嫌疑人,正全力抓捕。据遇害空姐李某家属的朋友...

比特大陆“暴利经”:靠挖矿机年入百亿元

比特大陆“暴利经”:靠挖矿机年入百亿元

本报记者陈佳岚李哲北京报道炙手可热的比特币让相关设备制造商赚得“盆满钵满”。北京比特大陆科技有限公司(以下简称“比特大陆”)是一家初创公司,...

首支公益无人机救援队成立 京东:就近调配自营物资

首支公益无人机救援队成立 京东:就近调配自营物资

新浪科技讯5月11日上午消息,中国灾害防御协会与京东集团签署关于无人机参与救援工作的合作协议,这标志着着首个全国性公益无人机救援队正式成立。...

“国产三文鱼”这样检测寄生虫!用显微镜吗?

“国产三文鱼”这样检测寄生虫!用显微镜吗?

来源:饮食参考公众号龙羊峡的养殖淡水虹鳟鱼在市场上冒充大西洋鲑(真三文鱼)已有多年,一直都是闷声发大财的状态。最近不知道搭错了哪根筋,非要到...

国家网信办约谈“快视频”:暂停更新15天并下架

国家网信办约谈“快视频”:暂停更新15天并下架

原标题:国家网信办:要让网络短视频充满正能量近期,国家网信办会同有关部门,针对网络短视频行业存在的突出问题,开展了一系列专项治理行动,依法依...

“健康猫”涉嫌非法吸收公众存款被公安机关立案侦查

“健康猫”涉嫌非法吸收公众存款被公安机关立案侦查

新浪科技讯8月27日上午消息,广州市公安局新闻办公室今天通报:根据群众举报和公安机关调查,今日广州市公安局天河区分局依法对广州大象健康科技有...

淘宝天猫优惠券、奇趣发现、9块9、天天折扣尽在

爱比价妈妈-手机版-电脑版-文章首页