学术道德之篡改数据

比起捏造数据需要很高的智商加上很强的专业素养,篡改数据就显得容易多了,很多时候只要轻轻的massage一下数据,使之看起来仍然在误差范围内,但是看起来却不那么刺眼了。所以在学术界算是一个比较多见的事情。篡改数据按照作者的等级可以分成好多个层次,造成的影响也各不相同。领域内的大牛们篡改数据,很容易造成某个方向上的“虚火”,导致科研经费的分配不均与浪费,比如邻居家的黄禹锡事件。

黄禹锡教授是韩国所谓的干细胞复制医学权威、克隆之父、首席“最高科学家”,未来为韩国获取诺贝尔奖的第一人,一般民众甚至颂扬他为民族英雄。经调查核实,2005年刊载于美国《科学》杂志的黄禹锡论文数据纯属伪造。论文所指11个克隆胚胎干细胞系列中,九个是伪造,另外两个的真伪还有待进一步检验[1]。这个哥们搞大发了,非要把自己改的那么高,最后给人把台子一拆,这把摔的啊,这辈子算是毁了。

自家的情况实际上还要更严重一些。教授就不说了,一些涉嫌篡改数据的事情可可以追到院士身上。当然,院士他老人家知情不知情是另一回事,但是名字挂在那些被揪出来的文章上也是挺刺眼的,这个疤也是永远去不掉的。

既然大牛都免不了俗,就更别说小虾虾们massage一下data了。只是有时候看起来没有那么严重,或者看起来也是可以理解的样子。比如实验测量出来的数据噪声有点大,花了好多心思还是没法去除。主要的信号还在,只是叠加了这么个幅度还不小的噪声,有点难看。那么处理不处理这些数据呢?处理了,算是篡改数据吗?不处理的话,自己看得都有点难受,更别提挑剔的审稿人了。如果要求解释一下噪声源,那就很麻烦了。因为如果已经知道的话,早就改进了。就是因为不知道原因,那怎么解释呢。所以有时候为了减少麻烦,就做了一些处理,比如滤个波,让噪声看起来不那么显眼。心里还可以安慰自己,只是让读者的注意力更加集中在有效信号上而已。

或者按照模拟的结果进行了设计,最后发现实验结果有偏差啊(不存在偏差那几乎是不可能的,但是问题是有点大)。怎么办?你说文章里面把这两个结果一比较,审稿人肯定要问是设计的计算出问题了还是实验的问题。这个问题很多时候也是很难回答的。因为知道了的话,就不会是放这个结果上去了。而且实验的结果肯定是能得到的最好的结果了,没法改进了。那么回头改设计呗,参数那么多,massage一下参数总是相对容易得到跟实验比较接近的结果。这样虽然还是没有找到原因,但是从文章上看起来好像问题解决了。如果说这个事情很严重的话,好像也没有太严重,只是说实验的结果没有像设计的那么好而已。系统还是可以用的,要比捏造数据的性质要轻很多,至少还是做了不少事情的。但是这个事情还是逃不开篡改数据的嫌疑。

关于篡改数据,个人笔者认为,只要科研还存在竞争,还存在压力,这个事情就断不了根。仅仅靠个人的自律是解决不了问题的。

[1]比起捏造数据需要很高的智商加上很强的专业素养,篡改数据就显得容易多了,很多时候只要轻轻的massage一下数据,使之看起来仍然在误差范围内,但是看起来却不那么刺眼了。所以在学术界算是一个比较多见的事情。篡改数据按照作者的等级可以分成好多个层次,造成的影响也各不相同。领域内的大牛们篡改数据,很容易造成某个方向上的“虚火”,导致科研经费的分配不均与浪费,比如邻居家的黄禹锡事件。

黄禹锡教授是韩国所谓的干细胞复制医学权威、克隆之父、首席“最高科学家”,未来为韩国获取诺贝尔奖的第一人,一般民众甚至颂扬他为民族英雄。经调查核实,2005年刊载于美国《科学》杂志的黄禹锡论文数据纯属伪造。论文所指11个克隆胚胎干细胞系列中,九个是伪造,另外两个的真伪还有待进一步检验[1]。这个哥们搞大发了,非要把自己改的那么高,最后给人把台子一拆,这把摔的啊,这辈子算是毁了。

自家的情况实际上还要更严重一些。教授就不说了,一些涉嫌篡改数据的事情可可以追到院士身上。当然,院士他老人家知情不知情是另一回事,但是名字挂在那些被揪出来的文章上也是挺刺眼的,这个疤也是永远去不掉的。

既然大牛都免不了俗,就更别说小虾虾们massage一下data了。只是有时候看起来没有那么严重,或者看起来也是可以理解的样子。比如实验测量出来的数据噪声有点大,花了好多心思还是没法去除。主要的信号还在,只是叠加了这么个幅度还不小的噪声,有点难看。那么处理不处理这些数据呢?处理了,算是篡改数据吗?不处理的话,自己看得都有点难受,更别提挑剔的审稿人了。如果要求解释一下噪声源,那就很麻烦了。因为如果已经知道的话,早就改进了。就是因为不知道原因,那怎么解释呢。所以有时候为了减少麻烦,就做了一些处理,比如滤个波,让噪声看起来不那么显眼。心里还可以安慰自己,只是让读者的注意力更加集中在有效信号上而已。

或者按照模拟的结果进行了设计,最后发现实验结果有偏差啊(不存在偏差那几乎是不可能的,但是问题是有点大)。怎么办?你说文章里面把这两个结果一比较,审稿人肯定要问是设计的计算出问题了还是实验的问题。这个问题很多时候也是很难回答的。因为知道了的话,就不会是放这个结果上去了。而且实验的结果肯定是能得到的最好的结果了,没法改进了。那么回头改设计呗,参数那么多,massage一下参数总是相对容易得到跟实验比较接近的结果。这样虽然还是没有找到原因,但是从文章上看起来好像问题解决了。如果说这个事情很严重的话,好像也没有太严重,只是说实验的结果没有像设计的那么好而已。系统还是可以用的,要比捏造数据的性质要轻很多,至少还是做了不少事情的。但是这个事情还是逃不开篡改数据的嫌疑。

关于篡改数据,个人笔者认为,只要科研还存在竞争,还存在压力,这个事情就断不了根。仅仅靠个人的自律是解决不了问题的。

[1] http://www.bioguider.com/view-5964-1.html

发表评论

Your email address will not be published.

X

已达到阅读文章上限。免费订阅,获取更多

已达到阅读文章上限。免费订阅,获取更多
关于科研写作和学术出版的文章与学术资源,包括:

  • 820 +文章
  • 15+ 免费在线讲座
  • 10+ 专家播客
  • 10+ 电子书
  • 10+ 检查清单
  • 50+ 信息图