用挑选出的“病例”和“非病例”算出的ROC曲线可靠么?

一、一起来YY小明发现最新的文献中提出了一个新的指标“神奇标记物”(x marker,xM),通过定量测量xM,有可能能够帮助诊断疾病“x”(x disease,xD)。对于这种定量指标,当我们试图评价它对区分某一疾病或是预后状态的能力时,往往会使用诊断性研究中常用的统计学方法——ROC曲线,并计算曲线下面积AUC。

小明手头刚好收集了一批临床患者和他们的生物样本。其中总共收集了待诊断是否有xD的患者500例,都保留了生物样本,可供定量测量xM水平。500例患者中,最终通过随访确诊为xD的患者总共有50例。

二、问题来啦!

小明想通过绘制ROC曲线来评价xM对xD的诊断价值,下面哪种做法更可取呢:

1、小明必须把这500例患者的生物样本都拿来测一遍,这样才能保证ROC曲线是正确的,有价值的。如果破坏了真阳性率,就有可能导致ROC曲线估计系统性的偏离原始位置,AUC也不可靠了。对么?

2、把500例生物样本都做了实在太浪费,我们完全可以挑出确诊xD的50例真阳性患者,再从450例肯定没有xD的真阴险患者中随机抽取50例出来。这样只用对100例样本测量xM的水平并且绘制ROC曲线就行了。对么?

三、不看公式看结果

如果您是统计学大拿,或者以前诊断试验相关的知识足够扎实,想必已经在心中得出结论了。如果还没有得出结论,那就先跟着我们看一组模拟数据的结果,相信无需进行公式推导您也能大致了解一二了。

让我们模拟一下,保留全部确诊xD的50例真阳性患者,同时逐渐减少真阴性患者的数量,看看ROC曲线和AUC到底会产生什么变化。

先来看看几个ROC曲线的形状:

用挑选出的“病例”和“非病例”算出的ROC曲线可靠么?-图片1

  看图明显差不多啊!真阴性无论是保留原始的450例,还是逐渐进行随机抽样到最后仅剩25例,画出来的ROC曲线似乎都是一个模样的!所以如果从曲线上找分界点的话,当然也不会差十万八千里啊。

我们当然看到了他们有相似的曲线下面积(AUC),但是到底有多相似呢?让我们来看看汇总的结果。

用挑选出的“病例”和“非病例”算出的ROC曲线可靠么?-图片2

用挑选出的“病例”和“非病例”算出的ROC曲线可靠么?-图片3

  我们看看,好像无论是否对真阴性的患者进行抽样,以及抽样比例如何,AUC的点估计值都非常相近。换句话说,是否保留原始的真阳性、真阴性患者比例,并不太影响AUC的准确性。受影响的只有AUC估计的精度,也就是标准误(SE)和95%可信区间的宽度。

因此,即便是一个破坏了原始比例的横断面研究,或是在真实待诊断人群中随机、不等比例的抽取了部分真阴性、真阳性的患者。ROC曲线和AUC都还是可靠的。总之一句话,如果要用ROC曲线评价某一连续指标的诊断价值时,未必非得测量所有的待诊断人群才行。分别抽取一部分阳性、一部分阴性的患者,得到的结论也是对的。对于上面的两个问题,当然我个人还是倾向于选择2的。不过有时候如果真阳性率不算太高或太低,而且指标的测量不会成本太高,还是鼓励都测测的,毕竟对AUC的估计精度还是有些贡献的。

至于原理嘛,其实很简单。ROC曲线的本质是对特异度和灵敏度的连续计算和展示,而特异度和灵敏度对真阴性和真阳性的构成比并没有什么特殊要求,无论怎么调整都不会发生变化。

发表评论

匿名网友