“P<0.05”也不靠谱?《自然》建议引入“信心指数”

 “P<0.05”,是许多研究人员梦寐以求的结果。一旦获得这个结果,很可能就意味着论文发表、经费到位、甚至功成名就。然而,越来越多的证据表明这个统计方法有被滥用的嫌疑。

陷入“信用危机”的科研

今年一项对390名生物统计学家进行的调查显示,其中至少20%有过被合作者要求操纵数据的经历1。这种行为称为“p值篡改”(p-hacking),指操纵数据分析或选择性报道,直到“p<0.05”。p值篡改很容易造成假阳性,导致结果不可重复。

情况已经到了触目惊心的地步。一项《自然》杂志的调查发现70%的科研人员无法再现他人的研究,50%的人甚至无法再现自己的实验结果。

 “再现性危机”提醒我们“p<0.05”不是万能的。需要指出的是,运用传统贝叶斯统计方法得出一个假设成立的概率,往往不能全面地分析问题。

信心指数:未来论文评估的趋势

 美国斯坦福大学医学院流行病学教授Steven Goodman最近在《自然》杂志撰文,建议使用“信心指数”(confidence index)2 来评估研究结果的可靠性。信心指数是一个复合指标,考虑到三方面的因素:过往研究证据的影响、研究者对结果真实性的判断、和研究的局限性分析(目前仅作定性分析)。

美国统计学会有感于“p<0.05”之流弊,于2016年发布公告,强调其非唯一标准2。而“信心指数”目前只是一个理念而已,到真正应用还需要大量的统计学工作。当然,时刻更新知识,做最好的科研是最重要的;关注一些高质量的网络课程,时刻为自己充电也是不错的选择。

发表评论

Your email address will not be published.