一窥科研出版产业:期刊如何断言
我 19 岁的时候去了一趟美国。我搭公共汽车穿越了整个国家,从一个州到另一个州的途中,我读了很多书,其中一本是 Peter Drucker 的《The Effective Executive》。这本书中传达的一个重要思想是:“了解您的业务。”例如,如果你认为自己在做石油业务,那你就错了,实际上,你在做能源业务。如果你在做邮政业务,那么事实上你是搞通信的,你最好了解电子邮件的影响!
学术出版业在做什么“业务”?内容业务?不是。期刊在做哪些业务?我会说期刊是在做“断言”业务。以下是期刊作出的一些断言:这个内容值得一读,因为它很新颖而且是原创的,这些是作者,这些是机构,内容已经通过同行评审,统计数据支持结论等。想想期刊所做的工作,期刊其实是在收集关于内容的多种断言,正是这些断言使内容变得有价值。
过去,期刊通过格式暗示断言。期刊无需明确地说“这是标题”,“这些是作者”,“这是摘要”,所有这些都融入到了期刊使用的格式中,这是过去 350 年来沟通断言的一个好方法。这可以追溯到 Henry Oldenburg 的《Philosophical Transactions》:通过格式来传达断言。
但是断言业务正在发生变化,而且变得很快!首先,做出错误或不准确的断言越来越容易。如果期刊仅仅通过格式来传达断言,那么其他任何人都可以复制该格式。显然情况并非如此。断言的质量如何?如果你最近刚好做了一个毫无根据的断言,那其实是整个行业,包括 Retraction Watch 之类的网站,都会揭露这类问题。格式不再是断言质量的保证。
研究资助者每年花费 1.6 万亿美元,换算起来是每秒投入 50,000 美元,他们当然希望有更好的工具来评估研究成果。他们希望获得更高质量、准确和细致的断言。这些断言必须是机器可读的,不仅仅是人类可读的,如果断言更可靠,就可以证明研究投资的回报。
从期刊的角度来看,这是一个机会还是威胁?
暂且不考虑内容的工作流,而是想想断言的工作流。一位作者就他们提交给期刊的内容作出了许多断言:我是一位作者,这些是我的共同作者,这是这篇论文的资助者,以下是我使用的方法,数据支持结果等。期刊会评估这些断言的准确性,然后给出自己的断言:这项研究已经通过同行评审,这是原创的。接下来,期刊将断言归结为发表的内容。这是理解断言创建过程与格式创建过程不同之处的重要部分。
这意味着得看过程,或从技术性来讲,得看工作流架构。断言的标记方式对它们在工作流中的有效性至关重要。以 Brown 这个词为例。这个词是指大学吗?名字?颜色?还是街道地址?让我们使用简单的标记吧。例如,<b> Brown </b> 告诉软件应用程序,Brown应该是粗体:Brown。不过,这是格式,这不是传达断言的可靠方式,因为它没有提到 Brown 是什么。
使用语义标记,比如 <author> Brown </author>,就能很清楚知道 Brown 是作者。但是,由于不同的出版物可能使用不同的语义标记来描述作者,例如 Contributor、Author 或 Article Author 等词,所以仍然存在一些歧义。因此,需要一种共同商定的方式来标记作者,这就是文档类型定义 (DTD) 的由来。
JATS (Journal Article Tag Suite) 是商定标记学术期刊数据的一种方式 (DTD),这个软件通过阅读文字外的标记知道 Brown 指的是作者。然后可以使用样式表进行“规则”格式化,即标记为作者的任何内容都应加粗体。因此,作者这个词是粗体的,并且放在论文中的正确区域。
格式化只不过是陈述。谈到格式化时,就不能不谈 XML。人们可能倾向于将 XML 当成一种“花哨”且便捷的格式化方式,但 XML 不止于此。期刊可以更改样式规则集,例如,所有作者姓名都应该以蓝色显示,这一更改会即刻生效。尽管如此,为了充分利用 XML,需要使用持久标识符。让我们从名为 Brown 的作者的案例来看 ORCID,在这种情况下,ORCID 将准确告知软件该期刊所指的 Brown 是谁。通过使用 API 集成,期刊可以确认,不是任何人都可以断言我们所讨论的是哪个 Brown,而是有一个权威来源(即 ORCID)。
如果一个新用户决定手动将 ORCID iD 输入到稿件的 XML 中,那么除了向 XML 输出中添加一些文本以外,不会实现任何其他功能。问题在于通过文本输入的 ORCID 从未被验证过,调用 ORCID 数据库的 API 是将 ORCID iD 添加到 XML 的“正确”方式,从而使用户可以自己验证他们的 ORCID iD。在 XML 中输出已验证的 iD 是贯穿整个工作流中的一个可靠断言。
可以采用相同的方法为工作流添加更可靠的断言。例如,通过识别作者所隶属的机构,举例来说,作者或机构可以通过 Ringgold 机构标识符验证他们隶属于中国的“东北大学”,而作者 Brown 隶属于中国东北大学这一断言得到了验证,能够长期记录在工作流中,这类断言对资助者来说很有价值,因为它可以帮助资助者跟踪他们的投资。但我们可以做更多,现在我们知道谁做了研究以及他们属于哪个机构,但我们不知道他们做了什么。在此,CRediT 角色可以断言贡献和工作流的贡献程度。Open Funder Registry 标识符可以确认谁资助了研究,可以使用 DOI 链接来对引用断言,等等。这种相互关联的断言逻辑可以应用于期刊工作流的许多方面。
谈到期刊的工作流,让我们讨论下同行评审。在 Editorial Manager 等同行评审系统中,有些工具可支持做出和验证其他期刊断言:这个内容是抄袭的吗?这个内容是新颖的吗?(查重,Meta)引用是否准确?(参考文献链接)是否披露了利益冲突?统计数据是否准确?(StatReviewer)
一旦创建,这些断言就可以传给其他工具用于其他用途,如搜索审稿人,确认审稿人操作状态以及估算和处理 APC。换句话说,一旦有了宝贵的断言,你的内容就可以“说话”!
在“内容要免费”的世界里,断言代表出版商增加价值并创造收入的机会。开放获取和开放科学的发展凸显了这一点,并使期刊开始不止停留在“贩售内容”上。这需要从基于内容的工作流转变为基于断言的工作流。期刊的同行评审系统是一个断言管理系统,通过与持久标识符和分类法的整合,帮助出版商做出和管理断言。出版商的营销部门不仅需要提供“最佳内容”,更要提供“最佳断言”。
出版商比以往任何时候都更应了解他们业务的核心。1981 年我在旅途中读 Peter Drucker 的书时学到的东西比以往任何时候都更显重要!
【本文是根据 2016 Editorial Manager 用户群组会议中的简报写成,点击观看视频。】