图解SPSS数据分析(二):正态性检验和其他统计分析过程

本文介绍利用SPSS软件进行数据正态性检验以及其他常见统计分析方法包括相关(适用于两个变量的相关关系)、多元线性回归、Logistic回归、COX回归和生存分析的详细过程。正态性、方差齐性是T检验和方差分析的基本的条件,看过文章图解SPSS数据分析(一)的小伙们可能已经注意到,T检验和方差分析的结果中,已经有了方差齐性检验的结果。在一般的统计分析中,想要P<0.05,说明差异有统计学意义;但是在正态性检验和方差齐性检验中,想要的是P>0.05说明方差齐或服从正态分布。

正态性检验

一般来说,若影响某一数量指标的随机因素很多,而每个因素起的作用均不是太大,那么这个指标服从正态分布(可以自己直观地判断一下)。另外,当样本量足够大时(通常N>100),任意分布的数据,其样本均数的分布近似于正态分布(不是小编瞎说的,这可是有数理统计理论证明的哟)。当然最客观地就是做个正态性检验了,正态性检验的SPSS操作如下(采用相关中例1的数据,判断age、x变量是否服从正态分布):

(1)依次点击:分析、描述统计、 探索,打开探索框,下图①。

(2)将age,x选入因变量列表,点击:统计量,勾选描述性,点击:继续,如下图②。

(3)点击:绘制,按照下图③勾选(仅供参考,也可根据自己兴趣选择),点击:继续。

(4)其他都默认,点击:确定,结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片1

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片2

  下面就开始接着上次的继续介绍统计分析方法了。

1、相关(适用于两个变量的相关关系)

相关一般可分为:线性相关(计量资料)、秩相关(等级资料)、分类变量的相关分析(计数资料)、非线性相关。今天我们就说一下最常见的简单线性相关(Pearson积矩相关),要做线性相关就需要满足二元正态分布,所谓二元正态分布,就是要分析的两个变量必须服从正态分布,否则就要用秩相关。现在就看例题吧(上面的正态性检验已表明:年龄和尿肌酐含量都服从正态分布)。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片3

  SPSS的操作如下:

(1)依次点击:分析、相关、双变量,如下图①。

(2)将age、X选入变量框,相关性勾选Pearson,显著性检验勾选双侧检验,勾选标记显著性相关,点击:选项,统计量勾选均数和标准差,缺失值选默认即可,点击继续,如下图②,点击:确定,结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片4

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片5

  2、多元线性回归:

多元线性回归是探索一个连续型变量(因变量Y)和其他多个变量(自变量X)(计量、计数、等级均可)间线性关系。此时,仅需因变量Y满足正态分布即可。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片6

  SPSS的操作如下:

(1)依次点击:分析、回归、线性,如下图①。

(2)将Y选入因变量框,X1、X2、X3、X4均选入自变量框,方法选择进入(也可以选择其他进入方法),如下图②。

(3)点击:统计量,按下图②勾选,点击:继续。其他都选默认就可。点击:确定。结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片7

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片8

  3、Logistic回归:

Logistic回归与多元线性回归类似,只是Logistic回归的因变量Y变成了分类变量,而多元线性回归的因变量Y必须是数值变量。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片9

  SPSS的操作如下:

(1)操作前,需要先对f进行加权。依次点击:分析、回归、二元logistic,将Y选入因变量框,X1、X2均选入自变量框,如下图①。

(2)点击:选项,按下图②勾选,点击:继续。其他都选默认就可。点击:确定。结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片10

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片11

  4、COX回归:

cox回归与多元线性回归、Logistic回归类似,只是cox回归的因变量Y有两个因素,一个是生存结局,一个是生存时间,主要分析生存资料。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片12

  SPSS的操作如下:

(1)依次点击:分析、生存函数、cox回归,将t选入时间框,将y选入状态框,将X1、X2、X3、X4、X5、X6均选入自变量框,方法选择进入,如下图①。

(2)点击:定义事件,在单值处写1,如下图②,点击:继续。

(3)点击:绘图,勾选生存函数,点击:继续。点击:选项,按下图②勾选,点击:继续。其他都选默认就可。点击:确定。结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片13

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片14

  5.生存分析:寿命表法求生存时间

SPSS的操作如下:

(1)依次点击:分析、生存函数、寿命表,将t选入时间框,显示时间间隔可根据自己数据生存时间选择,将y选入状态框,点击:定义事件,在单值处写1,点击继续。如下图①。

(2)点击:选项,勾选寿命表、生存函数。如下图②,点击:继续。点击:确定。结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片15

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片16

  Kalan-Meier法比较两组生存率的差异

SPSS的操作如下:

(1)依次点击:分析、生存函数、Kalan-Meier,将t选入时间框,将y选入状态框,点击:定义事件,在单值处写1,点击继续。将x2(性别)选入因子框,如下图①。

(2)点击:比较因子,按下图②勾选。

(3)点击:选项,按下图③勾选。点击:继续。点击:确定。结果就出来了。

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片17

  结果如下:

图解SPSS数据分析(二):正态性检验和其他统计分析过程-图片18

  图解SPSS数据分析(二):正态性检验和其他统计分析过程的分享到此结束。

参考资料

《卫生统计学》第7版,方积乾主编,人民卫生出版社,2014年5月

《SAS统计软件应用》,贺佳主编,人民卫生出版社,2014年4月

发表评论

匿名网友