GEO数据做生存分析

  • A+
所属分类:Genomics

一、数据下载

打开GEO,选择GSE17538 数据,然后下载MINiML。

二、格式转化

然后导入GEO_Convert.exe 工具。

导出样本信息数据和数据矩阵。

三、格式修改(可以防止踩大坑)

利用excel打开样本信息文本。

坑1:建议将将要用到的时间列和状态列名字改短。否则在工具中打不开。overall_event、overall survival follow-up time。

坑2:GEO的数据中一般是利用0代表 生存,1代表死亡。但是有些数据不是这样的,所以这里需要对death和no death 进行替换。否则会报错。

坑3:最大的坑就是某些特殊符号。这个时间列和状态列存在特殊符号比如;、,等。这些都是特殊符号需要替换掉。建议如果没有多次随访信息,直接替换掉全部特殊字符。

最后处理之后的表格:

然后保存,进入最后的生存分析部分。

四、生存分析

打开生信人小工具生存分析

导入表达数据和样本信息。

选择数据来源为GEO(默认也是GEO,请忽略截图)

然后选择状态列为stat列(0,1)

时间列选择为os-time(主要选择时间单位年、月、日)

然后点击导出结果。

然后导出表格如下,看到是不是很亲切,是的,这个表格可以放在文章里的。然后细心的童鞋会

发现这里已经按照P值进行过排序了(拿走,不写)。

另外软件中可以交互的看每个基因生存分析的关系。

这个图同样可以导出矢量图,可以自主调整颜色放在文章里的。

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: