距离计算方法总结 Bioinformatics

距离计算方法总结

在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关...
阅读全文
被忽视的Samtools参数 Bioinformatics

被忽视的Samtools参数

Samtools是一个用于操作序列比对结果sam和bam文件的工具合集。 sam文件格式 SAM格式由两部分组成:头部区和比对区,都以tab分列。 头部区:以’@’开始,体现了比对的一些总体信息。比对...
阅读全文
看懂Circos图 Bioinformatics

看懂Circos图

首先我们通过下图从整体上了解下Circos的工作流程,其中核心的是config配置文件,它决定了Circos的每一圈读入什么样的数据,并且决定它们以什么方式展示,是柱状图还是散点图,也包括颜色、字体等...
阅读全文
主成分分析(PCA)原理详解 Bioinformatics

主成分分析(PCA)原理详解

一、PCA简介 1. 相关背景 上完陈恩红老师的《机器学习与知识发现》和季海波老师的《矩阵代数》两门课之后,颇有体会。最近在做主成分分析和奇异值分解方面的项目,所以记录一下心得体会。 在许多领域的研究...
阅读全文