Windows下使用HTSeq计算read count

评论2,453

重新开始更新我的博客。

这一周主要就在纠结怎么用HTSeq计算read count。最初尝试使用linux服务器,最后没安装成功。换过mac,还是不成功。最后只好选择在window下安装的方法。

安装HTSeq之前,需要先安装Python,numpy,matplotlib。这些软件都有windows版本,很多都是默认32bit系统。

所以在安装这些软件前,你要确认电脑的系统是32bit还是64bit。

Python,numpy,matplotlib,HTSeq这些软件的版本之间也需要相互匹配。如安装HTSeq你就只能安装Python2.7系列。

从网上找到以下组合,python-2.7.5,numpy1.6.2,matplotlib1.2.0以及HTSeq-0.5.4p2。(没有标明网址的软件,只需要在google中搜索以下就可以找到)

1.下载python-2.7.5.amd64.msi

2、下载numpy,从http://www.lfd.uci.edu/~gohlke/pythonlibs/下载numpy-unoptimized-1.7.1.win-amd64-py2.7.exe

3、下载matplotlib1.2.0

4、下载HTSeq-0.5.4p2.win-amd64-py2.7.exe

另外,找不到模块这个错误,需要安装vcredist_x64_2012.exe(HTSeq网页上的版本可能不对)

整个过程,最重要的是版本兼容,都需要x64版本。

=============================================================================================

现在开始使用HTSeq啦。

cmd

cd C:\Python27

python -m HTSeq.scripts.count -s no input.sam annotation.gtf >output.htseq.counts

开始计算----------------

Windows下使用HTSeq计算read count

最后,计算得到的output.htseq.counts就在C:\Python27这个文件夹中。

如果你打开output.htseq.counts,发现所有的count都为0,那是因为你的annotation.gtf与input.sam文件生成过程用到的gtf文件不同,换成input.sam用过的gtf文件就可以。

HTSeq的作者Simon Anders建议使用ENSEMBL的gtf文件。

原文来自:http://chenxindayangzhou.blog.163.com/blog/static/2809209220137234916786/

发表评论

匿名网友