SPSS:病例-对照匹配（case-control matching）的实现过程

2015/03/04来源：临床流行病学和循证医学(陶立元赵一鸣)评论2,466

匹配(Matching)又称配比，是指为每一个处理组的研究对象选择在某些特征上一致的对照组对象。匹配的目的是控制某些因素对处理效应的影响，从而评价处理因素对结局的真实作用。经典的匹配方式是首先选定一些匹配变量，然后逐一对变量进行匹配，为每一个病例找出同期的合适的对照，这个过程就像找对象。近年来还有一种匹配方法被广泛应用，即倾向性评分匹配(Propensity Score Matching，PSM)。它是通过某种模型求得多个协变量的综合倾向性得分，再按照得分是否接近进行匹配。

如果上面的过程不好理解，那么举个例子。比如替某女孩找对象，该女孩列出以下3个条件：1年龄要与自己相差不大(±2岁)，2民族与自己一致，3学历与自己一致。那么如果是经典的匹配方法，首先是按照这些条件删选男生，然后在符合条件的男生中随机抽取一个男孩介绍给这个女孩。如果是PSM呢，首先给出一个评分方法，比如总分=0.8*年龄 2.3*民族 1.6*学历，然后对该女孩和众多男孩分别求得分，找出一个得分与该女孩最为接近的男孩，介绍他们认识。如果得分接近的有很多怎么办?还是选择一个。

PSM从理论来说比经典的病例-对照匹配方法要更为合理和科学，因为其配对过程中考虑了每个因素不同的影响能力(权重)。但是其实现过程中也存在一些问题，比如：如何选择合适的匹配因素?采用何种方法训练模型?采用何种匹配方法(邻近匹配、卡钳匹配、马氏距离匹配等)?本文不谈PSM，说说经典的匹配方法，如何通过SPSS实现。

例：目前有病例895人，对照2532人，要求按照年龄、职业和BMI组别进行匹配，即为每一个病例找一个跟他在年龄、职业和BMI水平上一样的对照，进行病例对照研究。

SPSS:病例-对照匹配（case-control matching）的实现过程-图片1