国度基因组科学数据中间专家论证汇合影
科技日报记者 张佳星
2018年、2019年持续两年,组学数据库权势巨子杂志《核酸研究》对前一年的全球基因组数据库扶植进行总结,鲜见识在美英两个老牌的数据库之外,提到了中国的GSA(组学原始数据回档库)。
“美国国立生物手艺信息中间(National Center for Biotechnology Information,简称NCBI)和英国欧洲生物信息学中间(European Bioinformatics Institute,简称EBI)30多年前已起头成立,我们的GSA是2015年末才上线运营的。”国度基因组科学数据中间主任鲍一明先容,中间的组学数据库之所以可以或许获得权势巨子杂志的承认“点名”,一方面是因为数据量增加快,另外一方面是数据的可用性、尺度化方面的工作均与国际接轨。
据领会,针对我国基因组学数据“存管用”的现实需求,解决数据孤岛等重年夜题目,科技部、财务部配合撑持组开国家基因组科学数据中间,依托中国科学院北京基因组研究所,结合中国科学院上海营养与健康研究所和中国科学院生物物理研究所配合扶植。中间的科学数据专业化团队,对外供给基因组学数据同一存储、整合发掘、同享利用的一站式数据办事。
适应年夜健康需求,修建自立数据根本
“之前,中国已成为基因组数据产出年夜国,但未能构成国度级公共数据资本。”鲍一明先容,面向国度年夜数据计谋成长需求,国度基因组科学数据中间环绕人、动物、植物、微生物基因组数据,重点展开了数据资本及数据库系统扶植,并展开了数据办事、系统运维、手艺研发、数据发掘等系列工作。今朝,国度基因组科学数据中间已具有自立常识产权的基因组数据汇交、办理与同享系统,保障数据平安性,支持并办事于国度重点研发打算、国度天然科学基金、中科院先导专项等300余个科研项目标数据存储、办理和同享。
在生命科学研究范畴,研究者取得的基因组学数据,均需上传到专业数据库,方可在杂志上颁发。现在,我国已具有取得承认的组学数据库,这将年夜年夜进步中国高程度论文被领受进程的便捷性。“中国的学者不需要再将数据‘飘洋过海’传输到海外,可以取得加倍专业化的中国式办事。我们的平台已被多家国际顶级杂志承认,中国粹者将数据提交到GSA系统,其颁发的论文已被多个国际着名期刊所收录,这包罗CNS(《细胞》《天然》《科学》简称)、美国科学院院刊等。”鲍一明说,这为“用好科技资本、支持立异成长”供给了根本。
截至2019年8月,国度基因组科学数据中间已为国表里150多个单元供给免费数据存储办事,累计用户递交项目信息跨越1200个,用户提交的测序数据量跨越1.2PB,搜集并存储的数据总量跨越4PB,数据上传下载量日均到达1TB。
与国际接轨,不做信息孤岛
生物信息的数据要海量整合后才会有价值,割裂的数据库只完成了“存”却难以走向“利用”。例如对人类组学数据的整合和发掘将更周全地取得人类健康题目的解决方案,避免“瞽者摸象”。
这恰是国度基因组科学数据中间成立的初志和扶植的标的目的。在科学数据同享方面,科技部持久致力于打破条块朋分,对相干部分和行业持久延续堆集的数据资本,和对国度科技打算项目标数据进行清算、汇交和建库,同时进步与国际科学数据组织的信息互换能力。
2019年,我国国度基因组科学数据中间组学数据库被国际闻名出书商Elsevier收录为指定基因数据回档库,其权势巨子性获得国表里100余家学术杂志的承认。国度基因组科学数据中间已成为有国际影响力的基因组科学数据中间。
今朝,国度科技根本前提平台中间正在组织国度科学数据中间编制五年扶植运行实行方案。将来,国度基因组科学数据中间将继续环绕基因组科学研究前沿及数据的存管用需求,慢慢完美中间组织办理架构与运行机制,强化步队扶植,培育复合型数据人材;成立数据同享、质量节制、平安办理等尺度与规范,操纵云计较、人工智能、机械进修等进步前辈手艺,晋升数据贮存、办理、发掘与同享能力;成长数据加密、解密、分级办理、受控拜候等数据平安关头手艺,成立人类遗传资本数据办理系统,确保国度主要生物质源数据当地化存储、办理与同享操纵。
鲍一明暗示,但愿颠末5年尽力,建成会聚海量科学数据、办事万家机构、引领年夜数据手艺立异的国际一流基因组科学数据中间,切实解决我国基因组数据存管用难、数据流掉严重、焦点基因组科学信息资本先“出口”再“入口”的题目,不竭晋升我国在基因组学年夜数据范畴的国际话语权。
加载更多>>