- 文章
- 热门
为了科研进步,拥抱开放数据任务的国家
看到“开放”这个词,你会想到什么?如果你想到了开放科学(open science)或者开放数据(open data),那么你肯定跟上了在目前学术发表中最火热的话题。
一直到几年前,共享研究数据是完全难以想象的;研究人员多对数据小心翼翼,认为发表科研成果就够了,但是今天,身在科研圈的人已经知道要让数据容易存储、访问和共享的好处和需要。开放获取的概念无疑改变了学术出版的模式,越来越多的科研单位、出版商、投资单位和研究人员开始相信开放数据的好处,例如,在英国开放数据研究所(Open Data Institute)已知有超过 250 家公司使用开放数据来创造产品创新,推展自身业务;出版公司爱思维尔(Elsevier)提到“为科研数据创造一个共享的生态系统”,推出推出开放数据试点给约 40 家期刊;一些科研人员也积极发声支持数据分享,并称分享数据的好处远大于预期风险。我会在这篇文章中快速介绍各国的数据共享政策,在看政策之前,我会依序简要介绍一下开放数据是什么、内容包含什么。
关于开放数据
研究资料(例如图片、表格、、公式、计算和补充材料)的免费取得使他人在现有的研究上发展或者进行复制研究,促成科学进步,不管是在既有基础上发展或是复制原有研究,都是科学进步之要,但,问题是研究人员不愿意分享、数据没有存储或因复杂的收费限制所封存,造成大量科学数据的丢失,不过这个情况随着全球有越来越多人接受开放获取的观念正在逐渐改变。根据开放数据研究所所定义,开放数据(open date)是让所有人可以免费存储和访问的数据,并具有许可证可免费重复使用、分享和散布。开放数据任务(open data mandate)是指需要研究人员根据单位、基金方的规定来分享他们的数据这种政策面上的规则,例如,美国科技政策办公室(Office of Science and Technology Policy,OSTP)发出备忘录,规定由联邦政府资助的研究必须共享数据;像比尔及梅琳达•盖茨基金会(Bill and Melinda Gates foundation)这类的私人资助单位已设立严格的数据共享规则;英国工程和物理科学研究理事会(Engineering and Physical Sciences Research Council ,EPRSC)则是使用最多人谈论的数据共享。加拿大政府和奥地利科学基金(Austrian Science Fund)也都有开放数据政策等等,不胜列举。各家政策有所不同,有些机构要求研究人员在研究发表后公开数据,然而有些机构则要求从基金申请阶段就该分享数据,大多数的政策适用于公有或中央政府资助的研究(资金来自与纳税人或政府)。
数据共享六阶段
Figshare 的执行长兼创办人 Mark Hahnel 称 2015 年为“开放数据政策年”,他明确了数据共享的六个阶段,而世界各地的资助单位都已完成了前三阶段。
全球开放数据任务进展
鉴于对数据共享的积极态度,全球有许多国家的政府和机构正在落实开放数据相关政策,通过自己或者外部的资料库为数据共享能带来的长期利益累积资本,以下是几个国家状况。
美国
在美国对开放数据的重视直接来自总统办公室。由 OSTP 在 2013 年发出的备忘录中指出“任何接受中央政府资助经费每年超过 1 百万美元进行研究的联邦单位,需规划支出支持提升大众取得研究成果”。 据美国国家科学基金会(National Science Foundation,NSF)规定,所有 NSF 拨款资助的工作都该公开,包括主要数据、样品、实体收藏和其他支持材料等。美国国家卫生研究院(National Institute of Health,NIH)则要求数据应该在论文被接受的当下即公开。比尔及梅琳达•盖茨基金会的政策则是要求接受基金会资金的科研人员需要在论文发表之时公开相关数据,并且同意研究用于商业用途。其他要求数据共享的机构还有戈登与贝蒂莫尔基金会(Gordon and Betty Moore Foundation,GBMF,要求在数据收集或者 DNA 测序后的六个月内储存所有数据)、霍华德·休斯医学研究所(Howard Hughes Medical Institute,HHMI,在论文发表后立即公开分享,因为“作者的责任是让可用的材料、数据库和软件一起发表,如此其他人便可以验证或伪证研究结果,并朝新的方向拓展”)。
加拿大
加拿大政府正在制定“政府性开放科学实施计划”,其中包括推出由联邦政府资助的开放获取出版及数据、政策层面的修改和能让数据更容易取得的工具。
澳大利亚
澳大利亚国立健康与医学研究理事会(National Health and Medical Research Council,NHMRC)和澳大利亚研究理事会(Australian Research Council,ARC)都要求被资助的研究必须在发表后的 12 个月内被储存到开放获取的机构资料库。许多澳大利亚大学都有复杂程度不同的数据库,近来他们一同推出开放数据集合(Open Data Collections)。
中国
中国科学家一直因为政府部门的垄断,要取得国内研究的高质量数据极为困难。不过中国过肩自然科学基金委员会(National Natural Science Foundation of China,NSFC)和中国科学院(Chinese Academy of Sciences,CAS)在2014年公布一项倡议,要求研究人员在论文发表后的12个月内将论文储存到数据库并且允许公开访问。据开放数据发布的一份报告指出,“在中国,推动数据活动的是公民、非营利组织与城市政府领导人”。
日本
跟据联合国教科文组织(UNESCO)的报告指出,虽然日本的开放获取或数据共享未有政策层面上的发展,但有一些由政府资助成立的大学资料库。这份报告提到“5 个 OA 政策,其中两个来自资助者的,另三个则是机构”。2013 年日本文部科学省(Ministry of Education,Culture,Sports,Science and Technology)公布新数据库政策,日本学术发表界如何看待这些指标和未来发展仍有待观察。
其他在数据共享政策上值得注意的国家还有奥地利科学基金(Austrian Science Fund,如果允许的情况下,数据应该以允许无限制重复使用/引用的方式储存),、爱尔兰高等教育机构(Higher Education Authority,HEA)还有适用于接受瑞典研究理事会(Swedish research council)基金的研究人员的 Vetenskapsrådet 政策。
虽然一些政府和机构对数据分享政策的态度十分积极,有些仍正在萌芽,但很显然地国家执行开放数据任务在未来几年会是关键,因为这将决定现有政策的成功,以及新的政策出现的速度,欣慰的是人们普遍接受了科研数据应该要能免费取得的概念,让所有鼓励科学探索精神的人利用。
后记:本文只概述数据共享以及介绍各国政策中值得注意的点。关于开放数据和数据共享的其他面向,包含值得关注以及单独详细讨论的部分包括:建立数据库的过程、让数据开放所需成本、数据共享的例外、各种类型的许可证、研究人员对这些政策的反应、维护的公开数据的需要、开放数据任务的反应或反响、这些任务的成功指标、国家政策间的差异、和世界各地区的比较(例如,欧洲与亚洲)等。
相关阅读:开放获取和数据共享是令人兴奋的现象,《意得辑专家视点》已经有好几篇关于这些主题的文章,欢迎参考我们先前的文章: