首先要有Linux环境的服务器或PC,推荐最低需求: 64bit Linux System (Rethat, CentOS, Fedora), 4 core CPU processors, 2.26G...
什么是bootstrap
Bootstrap又称自展法,是用小样本估计总体值的一种非参数方法,在进化和生态学研究中应用十分广泛。例如进化树分化节点的自展支持率等。 Bootstrap的思想,是生成一系列bootstrap伪样本...
基因芯片数据分析中的标准化算法和聚类算法
第一部分 基因芯片的数据标准化(Normalization) 对基因芯片数据的标准化处理,主要目的是消除由于实验技术所导致的表达量(Intensity) 的变化,并且使各个样本(sampl...
WGCNA: an R package for weighted correlation network analysis
WGCNA: 是一个基于R语言编写的综合性加权关联网络分析软件,可以用于基因的共表达网络分析。主要分析功能有: network construction, module detection gene ...
GFF格式说明
gff格式是Sanger研究所定义,是一种简单的、方便的对于DNA、RNA以及蛋白质序列的特征进行描述的一种数据格式,比如序列的那里到那里是基因,已经成为序列注释的通用格式,比如基因组的...
NCBI在线BLAST可利用的数据库简要说明
Peptide Sequence Databases蛋白序列的数据库 nr All non-redundant GenBank CDS translations + Ref...
GO分析的相关工具
GO委员会工具 AmiGO [http://amigo.geneontology.org/cgi-bin/amigo/go.cgi] AmiGO提供检索和浏览GO委员会提供的本体学(ontology)...
FASTX-Toolkit
FASTX-Toolkit是一款用于处理Short-Reads FASTA/FASTQ文件的程序,里面包含了丰富的FASTA/FASTQ文件格式转换、统计等命令。 下面是其功能介绍: FASTQ-t...
FastQ格式介绍
为了便于测序数据的发布和共享,高通量测序数据以FASTQ 格式来记录所测的碱基读段和质量分数.如下图 所示,FASTQ 格式以测序读段为单位存储,每条读段占4 行,其中第1 行和第3行由文件识别标志和...
RNAseq中Reads的可视化及注释
对于复杂的组学数据,能尽可能方便地直接观察数据对于数据的分析和解释都非常重要,对新一代测序数据的可视化和交互展示是一个非常重要但容易被人忽视的问题.不深入考查数据的细节,而是满足于对数据的统计分析,是...