Bioinformatics

SAM/BAM文件处理

当测序得到的fastq文件map到基因组之后,我们通常会得到一个sam或者bam为扩展名的文件。SAM的全称是sequence alignment/map format。而BAM就是SAM的二进制文件...
阅读全文
Transcriptomics

RNA测序研究现状与发展

通常来说,某一个物种体内所有细胞里含有的DNA都应该是一模一样的,只是因为每一种细胞里所表达的RNA之间存在差异,才使这些细胞有所区别。诸如“为什么肿瘤细胞与正常细胞会不一样?”这样的重要问题都可以通...
阅读全文
Script

超几何分布

简单点说,超几何分布就是有限样本的无放回抽样。不同于有放回抽样的二项分布(每次贝努里试验成功概率是一样的),每次的概率不相等。 随机变量X的超几何概率分布: f(k,N,M,n) = C(k,M)*C...
阅读全文
Machine Learning

CNN网络结构的发展

CNN基本部件介绍 1. 局部感受野在图像中局部像素之间的联系较为紧密,而距离较远的像素联系相对较弱。因此,其实每个神经元没必要对图像全局进行感知,只需要感知局部信息,然后在更高层局部信息综合起来即可...
阅读全文