论文常见统计学错误分析

2013/01/30来源：爱科学评论1,708

卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法，而统计方法的正确与否直接影响到论文的质量。我们在编审稿件过程中，经常遇到统计学方法使用不当等问题。本文就当前医学期刊来稿中常见的卫生统计学错误分析如下。

1 统计结论的描述不确切

数理统计的基础是概率论，对统计分析的资料下结论的依据是小概率事件在一次试验中是不可能发生的。一般统计上习惯把概率P≤0.05或P≤0.01认为是小概率事件[1]。当通过假设检验(显著性检验)获得P>0.05时，认为是大概率事件,说明在这一次试验中很可能发生，因此接受假设，认为差异无显著意义(差异不显著)。反之，若P≤0.05，则认为差异有显著意义，P≤0.01差异有非常显著意义，也就是说P越小，就越有理由认为被比较的均数或率之间有差异。至于两者差异有多大，这要由它们之间实际相差有多大再结合专业知识来确定。不是由P≤0.05，还是P≤0.01来决定。一般统计上说的“差异显著”(P≤0.05)，“差异非常显著”( P≤0.01)是统计学的术语，它不同于一般意义上的“显著”概念。为了不至于混淆这两者的概念，现在统计学上主张用差异无显著意义或无统计意义、差异有显著意义或有统计意义、差异有非常显著意义或高度统计意义来代替以前常用的“差异不显著”、“差异显著”和“差异非常显著”。再有通过统计分析被比较的均数或率是否被认为有差别，决定于被研究事物有无本质差异和抽样误差的大小(又决定于个体差异的程度和样本例数的多少)，以及选用检验水准α的高低,而检验水准的高低是根据分析要求确定的，但在实际应用中有一定的灵活性。即使取同一检验水准，其样本差异虽无显著意义，当增加样本例数，由于减少了抽样误差，可能差异有显著意义。因此，P接近显著水准α时，下结论要慎重。下结论时，不仅根据统计学的结论，还要根据专业知识来判断。有的人只凭少量的统计资料就作出“有差异”、“无差异”的判断，并对所调查的数据下结论，是不科学的。而“有差异”、“无差异”这样的说法也是不对的。例如调查吸烟者与不吸烟者的慢性气管炎的患病情况(P<0.01)，只能说明吸烟者与不吸烟者患慢性气管炎差异有非常显著性意义，即吸烟者更容易患慢性气管炎，至于两者患病率相差是否显著，要结合专业知识来判断，而不能说非常显著。这种统计结论的描述性错误很常见，编辑在修改稿件中必须注意。

2 统计指标的误用

在来稿中，经常遇到统计指标的误用，常出现率与构成比，发病率与患病率，死亡率与病死率等的混淆。

2.1 把构成比当率 构成比是说明事物或现象内部各构成部分的比重，率为表示某种现象发生的频率或强度。它们都是相对数指标，用百分数表示。有一篇题为“某年某地5类传染病疫情分析”，该文作者认为，5类传染病的发病率依次为痢疾48.62%(3685/7579)、肝炎27.85%(2111/7579)、乙脑11.22%(850/7579)、流脑6.89%(522/7579)、麻疹5.42%(411/7579)。该资料是构成比，不是发病率，故犯了“以比代率”的错误。

2.2 发病率与患病率 发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比，强调在观察期内的新发病例数。而患病率则指观察时点的某病的现患病例数与该时点人口数之比，强调的是该观察时点上某病的现患(新、旧病例)情况。有人调查男性7674人，沙眼患者6235人，发病率为81.25%;女性调查2896人，沙眼患者2225人，发病率为76.83%。这显然是错误的，应该是患病率。发病率是指平均每1000人口中新发生的病例数。其计算公式为：某病发病率等于某年(期)内所发生的新病例数除以同年(期)平均人口数乘1000‰。例如某地某年年平均人口数为2500人，白喉发病28人，该地白喉年发病率为11.20‰。

2.3 死亡率与病死率 这也是两个容易混淆的指标。某病死亡率是观察人群中某病的死亡频率，一般以10万分率表示;某病病死率是某病患者中因该病而死亡的频率，一般以百分率表示。前者反映人群因该病而死亡的频率，后者反映疾病的预后。部分作者常将某病住院病死率误为某病死亡率。有人在“35例多器官衰竭患者的监护”一文中报道，累及器官数与死亡率：2个器官20例，死亡8例，死亡率为40%;3个器官10例，死亡9例，死亡率为90%;4个器官5例，死亡5例，死亡率为100%。很明显，作者在这里是将住院病死率误作死亡率来讨论。

3 对照设计不合理

“有比较才能有鉴别”，设立对照组是为了科学地鉴别。医学科学研究设立对照尤为重要。一些科研论文科学性不强的主要原因是对照不合理，甚至有的根本不设对照组。临床上不少疾病，都有一定的自愈率，病情自行缓解的现象更为普遍，影响疾病过程的因素就更为复杂，除治疗因素外，精神、环境、休息、营养、气候等都对疾病发生影响。如果不通过严格对照试验，很难作出正确判断。有人为了试验普通感冒疫苗的预防效果，将一批大学生随机分成疫苗注射组和对照组(注射生理盐水)。实验结果表明，疫苗组感冒的发病率减少了73%，而对照组也减少了63%，两组效果相差无几。该试验，如不设对照组，将会得出错误的结论。有的虽有对照组，但缺乏可比性。有人试验一种预防晕船的药，以乘客为对照组，船员为服药组，结论是：“有100%的预防效果”。因为船员中原先就没有人晕船，会晕船的人早已调离工作，所以这两组是不可比的。这样的试验既不能肯定药效，又不能否定药效。如果将乘客分为两组，采取志愿服药的办法，不愿服药的作为对照，也是不可比的，因为会晕船的人愿服药的较多，从来不晕船的人则很少自愿服药，所以采取自愿分组的办法是有偏性的，它会掩盖预防药的效果。另外，两组例数悬殊太大，其误差率也会增大。有的论文样本例数仅几例，很难说明问题。有的实验组上百例，而对照组仅几例，显然是不合理的，应该两组例数相等或相近。一般说来，计数指标每组样本不得少于20～30例，计量指标不得少于5～10例[2]。

4 样本选择不当

样本的选择要符合随机化的原则，这样才能使样本客观地反映总体。在来稿中我们发现不少作者对随机化分组的意义和方法不够了解，有的交待了随机抽样，而没有交待抽样和分配的具体方法;有的虽知道随机化分组的原则，但因怕麻烦，而没有认真执行;有的甚至为了提高论文的刊用率，而冠以随机化的字眼。为解决上述问题，编辑部在审稿时要求作者补充研究对象随机化抽样和分配的具体方法。前者如单纯随机抽样、系统抽样、分层抽样、整群抽样等;后者如完全随机化设计、配对设计、配伍设计、拉丁方设计、序贯设计、正交试验设计等。

发表评论