R语言:数据汇总/透视/提炼 Script

R语言:数据汇总/透视/提炼

汇总、透视、提炼、凝炼,对数据处理来说这些词的意思都差不多,R语言提供了很多函数处理这些事情,还有一些软件包也提供了非常方便的数据汇总功能,方法 不胜枚举。summary是获取数据概要最常用的函数,应...
阅读全文
怎样向NCBI提交基因序列 Bioinformatics

怎样向NCBI提交基因序列

当克隆得到一个基因后,就需要对基因信息向NCBI提交,获得一个登录号,以后写文章就可以直接引用登录号,而不需要在文章中列出序列信息,这里主要介绍比较常见的提交DNA和cDNA信息。 1、打开NCBI的...
阅读全文
SAM文件格式介绍 Bioinformatics

SAM文件格式介绍

在SAM输出的结果中每一行都包括十二项通过Tab分隔,从左到右分别是: 1 序列的名字 2 概括出一个合适的标记,各个数字分别代表 1  序列是一对序列中的一个 2  比对结果是一个pair-end比...
阅读全文
富集性分析 Bioinformatics

富集性分析

经常看到一些饼图,描述某些事物的组成,比如说有钱人的学历分布,然后我们可以看到高学历所占比例并不高,根据这个比例下结论通常是错的,这些比例说明不了问题,如果把各种学历在总体人口中的分布做为背景进行考虑...
阅读全文
常用的数据分析方法汇总 Bioinformatics

常用的数据分析方法汇总

一、描述统计 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。 集...
阅读全文
SAM/BAM文件处理 Bioinformatics

SAM/BAM文件处理

当测序得到的fastq文件map到基因组之后,我们通常会得到一个sam或者bam为扩展名的文件。SAM的全称是sequence alignment/map format。而BAM就是SAM的二进制文件...
阅读全文