数据出版在中国

数据出版在中国

1 何为数据出版?

在信息技术高度发展的今天,科研模式已经发生改变。科学数据不仅仅只是科学研究和科技文献的重要产出,已成为科学研究和促进社会进步的重要基础设施。科学数据的共享与出版也在近年来得到了关注及快速发展。

所谓数据出版,是指科研人员与科研机构按照统一规范的质量管理和控制机制,主要利用互联网及其他方式公开发布其通过观察、实验、计算分析等科研过程所产生的原始数据,或通过对已有数据进行系统化地手机、整理和再加工形成数据及数据产品的出版行为,以帮助使用者便捷地发现、获取、理解和再分析利用数据,并可在科研论文及相关研究成果中引用数据[1]。简单而言就是指基于同行评议的数据发表。(图 1 为 Geoscience Data Journal 期刊对其发表数据论文的一般性流程。)   

Overlay journal model for publishing data

2 数据出版的模式及国内外实践

根据不同的出版机构或出版模式,数据的出版大体可以分为以下几类:

(1) 独立数据出版

一般是数据中心对本机构保存的数据的独立出版。国内外的各种大型公共数据中心,提供数据存储和共享的,基本都可以视为这种数据出版模式。例如,全球生物多样性机构(GBIF)设立数据出版框架工作组(Data Publishing Frame Task Group),明确提出并详细讨论了科学数据出版框架,并在 Pensoft 出版集团的出版物中进行试点[2]。我国对数据的共享和发布也高度重视,科技部于 2005 年启动实施的国家科技基础条件平台,设立了基础科学数据共享网,以促进科学数据及资源的共享。中国科学院从上个世纪八十年代开始,即组建了中国科学院科学数据库项目的建设。经过 30 年的积累,提供在线共享数据量已达 655TB。另,中国西部环境与生态科学数据中心以“黑河综合遥感联合试验 (WATER)”“黑河流域生态水文过程集成研究” 和“黑河生态水文遥感试验(HiWATER)”为例开展了系列数据出版试点研究,形成了一套“数据发布-评审-引用建议-跟踪统计”的数据出版体系[3]

(2) 作为论文的辅助材料出版

是指数据作为论文的补充材料,随着论文一同提交至期刊或指定的数据中心,由其提供数据的保存、获取与共享服务。大多数传统期刊都采用这种数据出版的模式,一般来说,会要求作者提交相关数据至期刊网站。随着信息技术和科研模式的转变,部分期刊选择与专业数据中心合作,论文提交至期刊的同时,将数据提交到指定的数据中心存储。例如,世界最大的开放获取期刊 PLoS 一向要求论文作者向希望复制研究结果的同行提供数据,在 2014 年发布的最新数据分享政策中,要求作者在论文出版的同时立即公开所有数据,不能有任何限制[4]。 在我国,虽然很多期刊也明确要求作者提供相关研究原始数据,但真正执行情况还是一个很大的问号。值得一提的是,2016 年初,《现代图书情报技术》编辑部与科学数据存储库(ScienceDB,http://www.scidb.cn/index)合作,对投稿作者明确提出了支撑数据提交要求:所有投稿论文提交支撑论文结论的科学数据,并通过适当方式供研究共同体或社会公共共享[5]。这是我国传统学术期刊在数据出版方面一次有益的尝试。

(3) 数据论文方式出版

是指期刊出版有关数据集的描述性文章即数据论文,并且将数据论文存储在数据仓储中或发表在数据期刊上。国际上已有一些期刊专门出版数据论文,例如,2008 年起出版的《Earth System Science Data》(ESSD)、Nature 自 2014 年创办数据期刊《Scientific Data》,均属于这类数据出版模式,并提供相关数据的机构库存储与访问服务支持。在中国,《中国科学数据(中英文网络版)》(China Scientific Data)和“全球变化科学研究数据注册与出版系统”等也对数据出版方面做了初步实践。其中,《中国科学数据》(CN 11-6035/N, ISSN 2096-2223)是国家网络连续型出版物的首批试点刊物,专门面向多学科领域的科学数据进行学术出版。

3 数据出版的意义及思考

数据出版的意义及思考数据出版对科学研究及数据工作者具有重要意义。通过对数据进行出版,可实现数据的知识产权清晰,数据质量可信;通过对数据配以全球统一标示,可以长期保存并持久访问,并可在学术出版物中正式引用,亦可对数据引用情况进行跟踪统计与分析,从而客观评价其对科学发现的价值和影响(Impact),能够为生产、管理和共享数据的科学家提供一种激励机制。同时,也有利于科学研究的自我审查;通过支持数据再利用,还可降低科研成本,带动相关产业的发展[6-9]

同时,数据出版也面临很多挑战。例如,科研人员的数据共享意识还有待提高;评价机构对数据出版及数据论文的认可度还很不足;数据质量又该如何评价?等等。尤其在我国,虽然大家对于数据的出版和开放共享的关注度逐步得到提升,但还有很多方面需要改进,以便创造一个优质的数据出版和共享的生态环境。例如,应尽快制定数据出版和引用的标准规范,明晰数据版权信息,从而推动对科学数据的引用。鼓励科研人员和出版机构,以及数据中心相关人员积极参与到国际数据出版的相关活动和组织当中去,为我国发展数据出版创造一个良好的发展环境。依托现有科研机构的学术出版机构,选取一些有实际需求的期刊,开展数据出版的试点工作,发布高质量的数据集,探索数据质量评审和数据评价及引用方法。同时,应建立一批提供永久数据存储的认证数据中心,提供数据发布和存储服务。国家相关管理机构也应该积极应对数据出版的需要,出台相关政策,建立针对数据的评价体系和数据工作者的奖励机制,鼓励数据出版工作。

 

参考文献:

[1] 黎建辉, 吴超, 张丽丽, 李成赞, 胡良霖. 科学数据出版调查与分析[J/OL]. 中国科学数据, 2016,1(1). http://www.csdata.org/paperView?id=9. DOI: 10.11922/csdata.120.2015.0009.

[2] Roberts Dave, Moritz Tom. A Framework for Publishing Primary Biodiversity Data[J/OL]. BMC Bioinformatics, 2011,12(S15): l1[2011-12-15]. http:// www.biomedcentral.com/1471-2105/12/S15/l1.doi: 10.1186/1471-2105-12-S15-l1.

[3] 吴立宗,屈永华,王亮绪,等. 黑河综合遥感联合试 验的数据管理与共享[J]. 遥感技术与应用, 2010(6): 772-781.

[4] PLOS’ New Data Policy: Public Access to Data [OL].http://blogs.plos.org/everyone/2014/02/24/plos-new-data-policy-public-ac....

[5] 《现代图书情报技术》支撑数据提交要求[OL].http://manu44.magtech.com.cn/Jwk_infotech_wk3/fileup/1003-3513/NEWS/2016....

[6] 黄晓磊等.生物多样性数据共享和发表:进展和建议[J]. 生物多样性 2014,22 (3): 293–301.

[7] 英国皇家学会:科学是开放事业 [OL]. http://royalsociety.org/policy/projects/science-public-enterprise/report/

[8] Jump up^ Lawrence, B, Jones, C., Matthews, B., Pepler, S., Callaghan, S. (2011). "Citation and Peer Review of Data: Moving Towards Formal Data Publication". International Journal of Digital Curation6 (2): 4–37. doi:10.2218/ijdc.v6i2.205.

[9] 何琳,常颖聪.国内外科学数据出版研究进展[J].图书情报工作 2014,58(5):104-110. 

期待学术生涯高歌猛进,发表过程一帆风顺?

来加入我们活力洋溢的在线社区吧。免费注册,无限阅览。

社交账号一键登入

已有54300名科研人员在此注册。

Found this useful?

If so, share it with your fellow researchers