学术道德之篡改数据

比起捏造数据需要很高的智商加上很强的专业素养，篡改数据就显得容易多了，很多时候只要轻轻的massage一下数据，使之看起来仍然在误差范围内，但是看起来却不那么刺眼了。所以在学术界算是一个比较多见的事情。篡改数据按照作者的等级可以分成好多个层次，造成的影响也各不相同。领域内的大牛们篡改数据，很容易造成某个方向上的“虚火”，导致科研经费的分配不均与浪费，比如邻居家的黄禹锡事件。

黄禹锡教授是韩国所谓的干细胞复制医学权威、克隆之父、首席“最高科学家”，未来为韩国获取诺贝尔奖的第一人，一般民众甚至颂扬他为民族英雄。经调查核实，2005年刊载于美国《科学》杂志的黄禹锡论文数据纯属伪造。论文所指11个克隆胚胎干细胞系列中，九个是伪造，另外两个的真伪还有待进一步检验[1]。这个哥们搞大发了，非要把自己改的那么高，最后给人把台子一拆，这把摔的啊，这辈子算是毁了。

自家的情况实际上还要更严重一些。教授就不说了，一些涉嫌篡改数据的事情可可以追到院士身上。当然，院士他老人家知情不知情是另一回事，但是名字挂在那些被揪出来的文章上也是挺刺眼的，这个疤也是永远去不掉的。

既然大牛都免不了俗，就更别说小虾虾们massage一下data了。只是有时候看起来没有那么严重，或者看起来也是可以理解的样子。比如实验测量出来的数据噪声有点大，花了好多心思还是没法去除。主要的信号还在，只是叠加了这么个幅度还不小的噪声，有点难看。那么处理不处理这些数据呢？处理了，算是篡改数据吗？不处理的话，自己看得都有点难受，更别提挑剔的审稿人了。如果要求解释一下噪声源，那就很麻烦了。因为如果已经知道的话，早就改进了。就是因为不知道原因，那怎么解释呢。所以有时候为了减少麻烦，就做了一些处理，比如滤个波，让噪声看起来不那么显眼。心里还可以安慰自己，只是让读者的注意力更加集中在有效信号上而已。

或者按照模拟的结果进行了设计，最后发现实验结果有偏差啊（不存在偏差那几乎是不可能的，但是问题是有点大）。怎么办？你说文章里面把这两个结果一比较，审稿人肯定要问是设计的计算出问题了还是实验的问题。这个问题很多时候也是很难回答的。因为知道了的话，就不会是放这个结果上去了。而且实验的结果肯定是能得到的最好的结果了，没法改进了。那么回头改设计呗，参数那么多，massage一下参数总是相对容易得到跟实验比较接近的结果。这样虽然还是没有找到原因，但是从文章上看起来好像问题解决了。如果说这个事情很严重的话，好像也没有太严重，只是说实验的结果没有像设计的那么好而已。系统还是可以用的，要比捏造数据的性质要轻很多，至少还是做了不少事情的。但是这个事情还是逃不开篡改数据的嫌疑。

关于篡改数据，个人笔者认为，只要科研还存在竞争，还存在压力，这个事情就断不了根。仅仅靠个人的自律是解决不了问题的。

[1]比起捏造数据需要很高的智商加上很强的专业素养，篡改数据就显得容易多了，很多时候只要轻轻的massage一下数据，使之看起来仍然在误差范围内，但是看起来却不那么刺眼了。所以在学术界算是一个比较多见的事情。篡改数据按照作者的等级可以分成好多个层次，造成的影响也各不相同。领域内的大牛们篡改数据，很容易造成某个方向上的“虚火”，导致科研经费的分配不均与浪费，比如邻居家的黄禹锡事件。

关于篡改数据，个人笔者认为，只要科研还存在竞争，还存在压力，这个事情就断不了根。仅仅靠个人的自律是解决不了问题的。

[1] http://www.bioguider.com/view-5964-1.html