|
当中国科学家的论文频频登上 《自然》《科学》《细胞》等国际一流学术期刊,当中国的SCI论文发表数量上升到全球第二位,你可曾想到,这同时意味着大量一手、原始的科学数据也流到了国外?
目前,在生命科学领域,世界上有三大数据中心,分别位于美国、欧洲和日本。过去30年,中国学者为这三大中心贡献了30%以上的基因组数据,其中大部分与中国人群有关。
“根据国际学术期刊论文发表惯例,一篇论文所有的原始数据都必须上传到权威的专业数据库。”中国科学院上海生命科学研究院生物医学大数据中心副主任张国庆告诉记者,因为同行重复实验、杂志编辑审核论文,都需要调用原始实验数据。
地面遥感、天文观测、基因组、医学病例样本……利用这些科学数据所包含的丰富信息,数据中心可以深度加工出各种知识产品,并提供给工业界。中国科学院院士、中科院上海药物研究所所长蒋华良曾多次提议,应注重科学数据的保护和利用,当我国科研水平不断提升,科学数据的产出越来越多、质量越来越高,这一问题的迫切性也就日益突出。
与此同时,我国的大科学装置、高水平实验平台也越来越多。这些平台上产生、汇聚的科学数据也蔚为壮观。“过去,中国天文学家愁的是拿不到一手的科学数据,要做研究只能利用国外开放出来的,甚至购买别人的数据。这些数据不少已经被过滤、咀嚼过。”中科院上海天文台赵建海高级工程师说,他负责领导的国际合作团队研发出世界顶级底片扫描仪,并负责图像大数据的推进,“现在我们可以获得第一手数据,应该加以妥善利用,从中做出引领性的科学成果。”但这首先需要对科学数据有良好的收集、加工、流通等全过程的管理制度。
《科学数据管理办法》(以下简称《办法》),2018年1月经中央深改组审议通过,近日由国务院办公厅正式印发。《办法》旨在进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好地为国家科技创新、经济社会发展和国家安全提供支撑。
“有政策出台,我们很高兴,在我国科技创新中,科学数据的管理太需要加强了!”张国庆说,《管理办法》突出了科学数据共享利用“以开放为常态、不开放为例外”的理念,同时也强调了数据安全、知识产权保护等。
“原始数据就好像货物,如果杂乱堆放在仓库里,很难发挥作用,形成一个个‘数据孤岛’,甚至保管都会成为沉重负担。”他介绍,对于生物医学领域而言,好的数据中心会将数据进行加工,首先是确保数据的安全;第二是设计合理的制度,使数据中心发挥更好的汇聚科学数据的作用,比如帮助医生整理手头的临床数据,并促成科研各方的协同合作;第三则是给各种数据以客观的质量评价。
“我们也热切地盼望具有实际操作性的细则尽快出台。”张国庆说,他们正在建设的生物医学大数据中心就是要让生命科学、临床、环境等各类数据交汇在一起,加以分析、检索、利用。据悉,上海发起的首个国际大科学计划———人类表型组计划,就将科学数据处理的任务交给了生物医学大数据中心。
这是我国第一次在国家层面出台科学数据管理办法。当前,为什么要加强科学数据管理?对提升国家科技创新水平发挥什么作用?如何保障科学数据安全、提高开放共享水平?科技部有关负责人和专家作了解读。
“科学数据是国家科技创新发展和经济社会发展的重要基础性战略资源,是信息时代传播速度最快、影响面最宽、开发利用潜力最大的科技资源。”科技部基础研究司司长叶玉江介绍。
大数据时代,科技创新越来越依赖于科学数据综合分析。当代科学技术发展呈现出明显的大科学、定量化研究特点,科技创新越来越依赖于大量、系统、高可信度的科学数据,对科学数据的综合分析,本身就是科技创新的一种方式。一些科研团队中也出现了专门从事科学数据管理和应用的人员,负责科学数据的收集、整理和分析等。海量科学数据对生命科学、天文学、空间科学、地球科学、物理学等多个学科领域的科研活动更是带来了冲击性的影响,科学研究方法发生了重要的变革。
据介绍,近年来,随着我国科技投入不断增长,科技创新能力不断提升,科学数据呈现出“井喷式”增长,而且质量大幅提高。但面对当前科技创新对科学数据管理的需求,尤其是与欧美发达国家相比,我国科学数据的管理与应用仍然存在明显不足,是我国科技工作“短板中的短板”。
“特别是有许多高价值的科学数据并未在国内得到充分的共享和使用就流向国外,应该说我国在科学数据开发利用、开放共享和安全保护等方面还有很大改进空间。”叶玉江介绍,欧美等发达国家先后在国家层面制定了明确的政策以推动科学数据管理与开放共享,并且已支持形成了一批国家级的科学数据中心或高水平数据库,利用它们持续汇聚和整合本国乃至全球科学数据资源,并向社会进行开放共享。
当前我国正处于实施创新驱动发展战略和建设科技强国的关键时期,加强和规范科学数据管理是加强我国科技创新能力建设和保障国家安全的重要方式和手段。因此,在国家层面发布加强和规范科学数据管理的政策制度,推动科学数据开放共享,对于服务科技创新、提升政府公共服务能力和发展共享经济等方面具有重要意义。
《办法》的重要亮点就是突出了科学数据共享利用。按照“开放为常态、不开放为例外”共享理念,明确为公益事业无偿服务的政策导向,充分发挥科学数据的重要作用。
国家科技基础条件平台中心副主任王瑞丹介绍,近年来,我国在加强科学数据管理和开放共享方面开展了大量工作。科技部、财政部先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康8个领域支持建成了国家科技资源共享服务平台,初步形成了一批资源优势明显的科学数据中心。在国家重点基础研究发展计划资源环境领域、科技基础性工作专项等科技计划项目管理中,将科学数据汇交纳入项目管理流程,实现了一批数据的汇交整合与开放共享。
《办法》要求科技计划项目产生的科学数据进行强制性汇交,并通过科学数据中心进行规范管理和长期保存。
中国科学院地理科学与资源研究所孙九林院士表示,国家科技计划项目产生了大量的科学数据,多个部门已将科学数据汇交作为科研项目管理的重要内容。《办法》中对利用政府预算资金资助的各级科技计划(专项、基金等)项目所形成的科学数据提出了明确要求,要求由项目牵头单位汇交到相关科学数据中心。
针对科学数据利用率不高的问题,《办法》提出了三项措施:一是实行清单管理制度,由主管部门组织编制科学数据资源目录。二是鼓励科研人员整理形成产权清晰、完整准确、共享价值高的科学数据。三是在数据共享过程中,原则上对公益性事业及公益性科学研究无偿提供,确需收费的应按照规定程序和不盈利原则制定合理的收费标准;对商业活动利用数据的通过协商约定。
《办法》还提出加强国家科学数据中心培育和建设,明确提出要加强统筹布局,在条件好、资源优势明显的科学数据中心基础上,优化整合形成国家科学数据中心。
对于关注度较高的科学数据的安全问题,叶玉江表示,《办法》始终把确保数据安全放在首要位置,对涉及国家安全和秘密的科学数据如何把握好开放与保密的关系,作了原则性、政策性的规定。“科学数据管理必须要以安全可控为前提,按照国家有关法律法规,依法确定科学数据安全等级及开放条件,严格做好科学数据保密工作,建立数据共享和对外交流的安全审查机制。”
《办法》明确规定,对涉及国家秘密、国家安全、社会公共利益、商业秘密和个人隐私的科学数据,不得对外开放共享;确需对外开放的,要对利用目的、用户资质、保密条件等进行审查,并严格控制知悉范围。
同时,《办法》对主管部门和法人单位的职责做了明确规定,强化了法人单位的主体责任。明确主管部门和法人单位依法确定科学数据的密级及开放条件。针对部分科学数据流出国外的问题,《办法》规定主管部门、法人单位要建立相应的管理制度,确保在国外发表学术论文的作者将支撑论文观点的科学数据汇交到所在单位统一管理。
《办法》还加强了知识产权保护。对科学数据使用者的行为进行了规范,体现对科学数据知识产权的尊重。对科学数据生产者也做出了约束,如出现数据造假等行为,将受到相应惩罚。
近年来,我国科学数据呈现井喷式增长。大数据时代的科学研究,呈现出明显的定量化特点,创新越来越依赖于大量、系统、高可信度的数据。此外,海量数据还引发了科学研究方法论的变革,基于数据的分析和利用,正影响着生命科学、天文学、空间科学、地球科学、物理学等多个学科的研究方式。科学数据的基础支撑价值,让它日益成为传播最快、影响面最广、潜力最大的科技资源“富矿”。
作为基础性战略资源,科研活动离不开数据,要提升数据使用价值,开放与共享尤为重要。但长期以来,我国在科学数据的开发利用、开放共享和安全保护等方面存在明显不足,很多高价值的科学数据在国内没有得到充分的共享和使用。近年来我国也探索推动基础科学、农业、林业、气象等领域的科学数据开放共享,但整体缺乏顶层设计和驱动机制,统筹管理相对薄弱,科技领域往往更容易形成“数据孤岛”和“数据烟囱”。
科学数据的价值在于使用,“各自为战”弊端不少。比如,一位科学家告诉笔者,他参加某次学术会议时,得知同领域的另一个研究单位也在做着同样的工作,其中有不少还是“重复性劳动”。又如,在数据采集方面,不少科研院所、高校和国家的有关部门都建有野外台站,彼此间的数据却“老死不相往来”。一方面重复投资和建设突出,浪费了国家的资源;另一方面有的科研人员缺少仪器设备,又得不到丰富可靠的数据支持,“巧妇难为无米之炊”。
数据共享应用是国际通行经验。比如美国,20世纪70年代就开始建立数据自由方面的法规,90年代开始提出数据开放共享的概念,建了9个国家级数据中心。在我国,20世纪90年代很多科学家呼吁数据共享。1994年开始,中国科学院就有一批老先生给国家有关部门写报告,要求实现数据共享。1999年,科技部基础司提出了科技基础性工作的专项,其中就有加强科学数据资源建设。
2000年,中国气象局在国内率先实现部门内部数据共享。到2001年,国家开始搞试点,建设了8个数据中心。后来,经过财政部和科技部的专家遴选,选出了6个国家层面的数据中心,当时叫数据平台。
国家项目产生的科学数据要求进行汇交是从2008年开始的。当时为什么要这么做?因为国家已经意识到,国家投资大量经费产生的数据资源没有能够在国内得到充分利用,有的数据甚至流向了国外。
到了2010年,国家要求“十一五”国家投资的项目要汇交数据。2014年,科技部要求国家基础性工作专项产生的数据要进行汇交,因为发现数据汇交的工作很重要。现在,根据《办法》要求,国家财政经费投资产生的项目数据资源都要进行汇交,开放共享,在项目验收时就应该进行数据汇交,如果数据不汇交就不能进行验收。
可以说,《办法》的出台经历了长期酝酿,并不是突然提出来的。因为科学数据太重要了。科学数据资源是国家重要的财富,也是生产力,必须把科学数据流动起来,共享应用。数据汇交的理念,过去在科技界已经形成了共识,现在用《办法》把它规定下来。
现在是大数据时代,数据是很重要的资源,但这个资源必须共享应用才能变成财富,比如社会大数据、政府管理的大数据、互联网的大数据。《办法》主要瞄准科学研究、科技创新的数据资源,因为科学数据完全可以支撑国家信息产业或者大数据产业,而且数据资源越用越有价值。当然,前提是共享。
作为国家重要的战略资源,科学数据非常有意义,数据资源共享后如何进行整合、应用,值得各领域的科学家进一步加强研究。
根据新华社、人民网、光明日报、经济日报等採编【版权所有,文章观点不代表华发网官方立场】
|
|