样本量太大，怎么办?

2016/01/03来源：临床流行病学和循证医学 (曾琳，赵一鸣)评论1,718

在开展研究前需要通过估计样本量来确定研究中应纳入多少研究对象。而且大多数同学们肯定对样本量估计方法有一定的了解。但是，我相信大家都会有这样的无奈：计算出来的样本量太大了，臣妾做不到……怎么破?

我们都知道，影响样本量大小的因素是效应值，一类、二类错误水平，研究对象群体的个体差异以及统计假设。减少样本量最为简单的方法是提高二类错误的水准，也就是降低研究的统计效能。但是往往咱们不希望统计效能小于80%，如果统计效能过低，会让我们的研究得到阴性结果的风险增加。而这是研究者最不希望看到的。因此降低统计效能不在我们今天讨论的范围内。我们希望能找到既能减少样本量，又能提高或保证统计效能的方法。今天咱们来聊聊有什么方法可以减少样本量，提高检验效能(以治疗性研究为例)。

首先，如果研究的primary endpoint是临床结局(常为二分类变量)的话，那么建议研究者考虑把研究的primary endpoint改为一个替代指标(往往是连续变量)。学过统计的同学们都知道一个大概的原则，就是参数统计往往比非参数统计方法检验效能更高。检验效能高说明什么?简单可以理解为：检验出两组有差异需要消耗的样本量较少。如果我们的研究终点评价指标是二分类变量，那么我们采用的统计分析方法往往是非参或半参的方法，而如果我们的终点评价指标是连续变量，那就可以采用参数统计。所以一般认为连续变量作为研究的终点评价指标会比二分类变量更“节省”样本量。此外，我们知道临床结局很可能除了受我们研究中比较的干预措施影响外，还可能受其它因素影响。此时我们要是能选择一个与我们研究干预措施直接相关的biomarker(常为连续变量)，那么显然直接相关biomarker需要的样本量更少。比如，比较两种降压药的治疗效果，如果采用患者死亡或者MACE事件作为研究的主要终点评价指标那可能需要的样本量就会非常大。而如果把服药后3个月的血压水平作为研究的主要终点评价指标，那么计算出来样本量会更小。当然必须提醒大家，研究的primary endpoint不是能轻易修改的，请大家评估一下研究的阶段性，如果您的研究属于验证性阶段的话，那还是建议选择明确的临床终点作为primary endpoint，如果还处于一个探索阶段那可以把primary endpoint换为连续分布的替代指标。

除了把结局从二分类变量转变为连续变量外，另一个同样比较常见的减少样本量的方法是选择研究干预措施更为适用的人群或者说发生结局事件风险更高的人群。比如我们要开展一个降压药效果的验证性研究，我们的primaryendpoint是随访3年MACE事件的发生率，我们知道应用试验用降压药与使用对照药发生MACE事件的RR值是0.7。如果我们在对照组MACE事件的发生率为10%的人群中开展这个研究，那么我们需要的样本量为：1814例/组(α=0.05，power=0.9，两组比例1:1)。而如果我们选择在中重度高血压或者是高血压合并高血脂的患者中(假设对照组MACE事件的发生率为30%)开展这个研究，样本量将变为491例/组(α=0.05，power=0.9，两组比例1:1)。因此，精准的选择研究对象，也是一种能提高研究的检验效能，降低样本量需求的好办法。

最后声明一下：这篇文章不是教大家如何投机取巧，而是让大家在计算样本量时多思考，找到既能保证研究科学性，同时也能提高研究可行性的样本量确定方法。

发表评论