- Articles
- New
生物医药领域常见的5个统计学概念
作为生物医药研究者,厘清统计学概念并在论文中正确使用它们能避免读者对数据的误读。本文例举了五种统计术语,它们是研究型论文中的高频词汇,同时也是新手容易混淆的概念。
1.正态
normal在统计学中译为正态分布,也称为高斯分布。当连续随机变量的曲线为钟形时,即为正态分布。由于normal在英语中也有通常、典型的意思,在写作时最好明确语义。举例来讲,“A patient's blood pressure is normal.”这句话既可以理解为病人血压正常,也有病人血压值遵循高斯分布的意思。这种情况作者需在上下文中明确自己想表达的是什么。
2.随机
random一词的常见翻译是任意、随意,不过它在统计中另有所指。random sampling即为随机抽样,意思是从总体中抽样的每个个体被选中的机会均等,一般通过电脑生成随机数来实现。“We selected patients randomly for a clinical trial.”这句话可以理解为我们随机抽样了临床试验的患者。“We assigned patients randomly to treatment groups.”的意思则是我们在分配治疗组的时候采用了随机法。
3.平均值
average通常在统计中用于表示算术平均值,即为一组值的总和除以值的数量。不过由于average在日常英语中也有“一般的”这层含义,所以应尽量避免“The biomarker had average sensitivity.”一类的表述,容易产生歧义。可以用“the value of the average sensitivity”取代。
4.显著
英语中通常用significant表示重要的、有意义的。它在统计学中用来描述数据的显著性,当p值小于α值,实验结果显著。如要表达治疗结果具有显著性,可以说“statistically significant”或将措辞调整为临床结果“clinically meaningful.”
5.相关性
correlation在统计学中是指两个连续变量之间有联系。此处需要明确的是相关有别于因果关系,这是两种性质不同的逻辑关系。比如当我们说“There is a positive correlation between alcohol intake and asthma severity.”,意思是酒精摄入量越高的样本哮喘越严重。根据这则相关表述,我们可以建议在哮喘治疗中加入对酒精摄入的限制,但不能说少饮酒一定可防止哮喘病发。
希望所有需要和数据打交道的研究者,都能得出可靠的数据,并做出准确诠释。