Meta分析的10个原则

2014/05/01评论1,302

近年来文献数量显著增加，大量不同主题的Meta分析数量也显著增长。在生物医学领域，Meta分析是多种发表类型中拥有较高被引数的类型。针对Meta分析已经有不少书籍或指南，本文是一篇指导Meta分析的简洁文章，帮助入门者初步了解Meta分析的操作和撰写。

1. 明确Meta分析的主题和类型，

可以使用PICO原则来制定研究问题(详见：如何提出一个好的临床研究问题?)。关键是，要确认这一主题是否已有发表的Meta分析，以避免重复工作。在某些情况下，如果有新的数据产生，可以对该主题的Meta分析进行更新。

可以对多种类型的研究进行Meta分析，例如病例对照研究、队列研究和随机对照试验。由于观察性研究存在偏倚的可能性较大，在对这些类型的研究进行Meta分析时要考虑到这一点。此外，也可以对遗传关联研究，基因表达研究，全基因组关联研究(GWAS)或动物实验数据进行Meta分析。

建议在PROSPERO数据库(https://www.crd.york.ac.uk/Prospero)中预登记系统评价的方案。要知道，越来越多的期刊要求在发表前进行登记。

2. 遵循指南开展不同类型的Meta分析，

有几个常用的指南，例如，QUORUM声明(RCT的Meta分析报告规范)，MOOSE声明(观察性研究的Meta分析报告规范)，目前广泛使用的是PRISMA声明(系统评价和Meta分析优先报告条目)。

此外，还有一些关于临床研究Meta分析的具体指南(Cochrane手册;https://training.cochrane.org/handbook)，以及遗传关联研究(PMID ：19260758)、全基因组表达研究(PMID：18767902)、GWAS(PMID：23657481)和动物研究(PMID：24099992)相关Meta分析的指南(感兴趣的可以直接根据PMID去查看相关文献)。

3. 确定纳排标准、定义关键变量，

应该事先确定好纳入(如研究类型、出版语言等)和排除标准(如最小样本量等)。目前共识没有推荐关于发表语言或样本量的严格标准。

你应该清楚定义出需要从每篇文章中提取的变量。广泛的纳入标准会增加研究间的异质性，狭窄的纳入标准可能会难以找到研究，要取得均衡。

4. 在不同的数据库中系统检索，

提取关键数据，

可以在几个数据库中进行系统检索，例如PubMed，Embase，Cochrane数据库，Scopus，Web of Science和Google Scholar。通常情况下，在多个数据库中检索有助于尽可能找全已发表研究。

在某些领域，也需要在专业数据库中进行检索(例如BIOSIS，CINAHL，PsycINFO，Sociological Abstracts和EconLit等)。综述类文章的参考文献，有助于发现更多其他来源的文章(例如学位论文或会议论文)。

从原始文章中充分提取和记录关键数据是进行Meta分析的基础。对纳入研究的质量评估也是一个关键问题，这可以用于确定纳入标准、敏感性分析或研究的差异性加权。例如，Jadad量表经常用于随机对照试验(PMID：8721797);Newcastle–Ottawa量表用于非随机研究(PMID：20652370)，QUADAS-2用于诊断准确性研究的质量评估(PMID：22007046)。

建议两名研究人员同时进行这些步骤。但是读者也要知道，这些质量评估也受到诟病，特别是当他们将研究简化到一个单一的“质量”评分时。最重要的是，避免将原始研究报告规范指南作为评估研究质量的量表。

5. 联系原始研究的作者询问缺失数据，

原始研究的正文或者附录文件缺乏关键数据也是很常见的，因此需要联系作者获取缺失的数据。不过，作者的回复率通常没有预期的高。有很多标准可以促进已发表文章中原始数据的可获得性，例如MIAME和STREGA标准。

在一些领域，例如基因学，有可能使用一个研究的整合性统计数据就可以识别出一个人，那么就应对数据共享采用严格的标准，需要得到专门批准。

6. 为你的研究问题选择最佳统计模型，

需要注意，很多情况下，各研究报告的数据形式并不兼容，因此需要进行各种类型的转换。还好的是，如何提取和转换连续变量(PMID：8797521)、四格表(PMID：16025540)、生存数据(PMID：9921604)，已经有一些可用方法了。

通常情况下，Meta分析采用的是固定效应模型或随机效应模型。对于更复杂的数据，也有人提出了多元Meta分析的方法。其他统计操作涉及敏感性分析、Meta回归、亚组分析、异质性检验(如Q或I2)。

如果存在异质性，则应解释异质性的可能来源。尽管随机效应模型适用于研究间存在异质性的情况，但仍要确定异质性的来源，并应使用统计检验量化其对效应大小的影响，例如亚组分析或Meta回归。

发表偏倚是一个需要考虑的重要方面，因为在很多情况下，阴性结果文章的发表可能性更低。其他类型的偏倚，例如“赢者诅咒(winner’s curse)”，在遗传学领域较为常见，建议采用累积Meta分析的方法识别出来。

7. 使用规范软件进行统计，

有几个常用的软件可以用于Meta分析，有的软件是有统计包，例如Stata或R软件，有几十个包，大多数是用户编写的，可以处理绝大部分Meta分析的任务，甚至是复杂的Meta分析，例如网状Meta分析、GWAS和基因表达研究的Meta分析，详看：

https://cran.r-project.org/web/views/MetaAnalysis.html

https://www.stata.com/support/faqs/statistics/meta-analysis

还有一些软件专门用于Meta分析，例如OpenMetaAnalyst，NetworkAnalyst，JASP，MetaGenyo，EpiSheet (krothman.org/episheet.xls)，GWAR，GWAMA，METAL， RevMan (https://community.cochrane.org/help/tools-and-software/revman-5)。

某些情况下，运行某些程序时会报错，可能因为这些程序依赖于其他程序包。

8. 记录和研究报告须完整且透明，

除了所使用的Meta分析策略的细节之外，检索、纳入标准、筛选出的摘要和纳入研究的数量等数据都很有用，对纳入研究进行的质量评估也很有用。

可以构建一个电子表格，记录筛选标准中的每个步骤，这将有助于构建流程图。描述不同步骤间进展的流程图非常有用，会提高Meta分析的质量。如果将来需要对该Meta分析进行更新，这些记录也大有用处。此外，说明Meta分析存在的局限性也很重要。

9. 投稿时提供足够的数据，

Meta分析的文章中，有一张关于原始研究完整信息的表格(如作者、年份、纳入人群、DOI、PMID等)，非常有用，可以放在论文的正文中，也可以作为附录文件。应该指出所使用的Meta分析和生成关键图(例如森林图)的软件。应报告汇总的效应值，例如pooled odds ratios，包括置信区间。

在阳性结果的情况下，敏感性分析的图很有用。在更复杂的分析中，建议在附录文件中附上生成结果的脚本。

10. 针对你的发现建议未来研究方向，

讨论部分是Meta分析的重要组成部分，作者应该在目前已有文献和知识体系下对当前发现进行讨论。作者可以讨论Meta分析阳性或阴性结果的可能原因，基于现有的生物学或流行病学证据提供解释，并讨论个别研究的某些特征。

Meta分析通常综合了多个原始研究的证据，这些研究需要数年和大量资金，作者可以推荐未来进行原始研究的重要建议。

发表评论