- 文章
- 热门
Taylor & Francis 旗下 Basic and Applied Social Psychology 期刊宣布禁用 P 值
P值作为原假设检验的基础被广泛采用,向来被视为统计验证的“黄金标准”,不过许多专家对于 P 值的使用,还有 <0.05 代表显著的临界值存有异议,理由是 P 值很容易被人为操作,许多研究人员即使数据不够有力,也能用 P 值来支持研究结果,不支持 P 值的专家们也提到 P 值很不稳定,可重复性不强。
纵使有这些争议,P 值仍是众多研究的组成要素,Basic and Applied Social Psychology 期刊(BASA)为了凸显 P 值使用上的问题,宣布禁用 NHSTP(null hypothesis significance testing procedure,原假设显著性检验程序)以及相关的统计程序,代表编辑部说明新政策的编辑 David Trafimow 和副编辑 Michael Marks 提到:期刊先前已经声明过作者不需要操作 NHSTP,现在进一步宣布全面禁止使用,值得注意的是,Trafimow 表示他不知道有什么样的统计方法可以取代 P 值。
BASP 进一步说明:作者还是可以投稿有 P 值还有其他 NHSTP 统计方法的论文,他们会在发表前删除相关内容,此外,他们特别提到了虽然推断统计程序非必要,但期刊需要包含效应量的描述性统计,“我们也鼓励加上频率或分布数据,也鼓励使用比一般心理学研究更大量的样本数,因为随着样本数的增加,描述性统计会更稳定,抽样误差也不会是太大的问题。”
BASP 的决定引来正反两方面的反应,德国比勒费尔德大学(Bielefeld University)知名科学家 Jan de Ruiter 同意 NHST 不可靠,但不用它们可能不是一个对的办法,他表示:“搞科学不能没有推论统计”。除此之外,BASP 的使用大量样本数的政策也可能对年轻研究人员在进行初步研究时提出挑战,为了避免这个情况,期刊可能考虑针对初步和验证性研究制定另外的发表规则。
为了维持科学的精确性,有些研究人员提议用统计讨论或贝叶斯分析来补充 P 值,但目前 BASP 不倾向采用贝叶斯分析。虽然禁用 P 值的决定在科研界引起争论,BASP 的新政策使大家开始关注过度依赖 P 值的问题。