Transcriptomics

矫正批次效应

批次效应(batch effect)简单说来就是因为实验做了几个批次导致的实验误差,比如芯片数据,每次都要用机器读取,那么光照时间和强度每次都可能不一样, 极有可能出现批次效应。 再比如,实验的三个重...
阅读全文
Single Cell

单细胞RNA测序方案比较

目前,随着单细胞RNA测序技术(scRNA)的成熟,新的测序方案不断出现。那么,各种技术平台的性能如何呢?优缺点有哪些呢?如何根据我们的研究目的选择合理的单细胞RNA测序技术呢? 本文系统的比较了6种...
阅读全文
Statistics

ROC曲线

在分类预测中,我们一般比较关注准确率,但是,混淆矩阵也是非常重要的。尤其是当我们都其中的某一类别特别感兴趣的时候,通常要单独的看这个类别的召回率和精度,比如在癌症诊断过程中,我们宁愿错误的认为一个人是...
阅读全文
Machine Learning

数据降维与可视化之t-SNE

t-SNE是目前来说效果最好的数据降维与可视化方法,但是它的缺点也很明显,比如:占内存大,运行时间长。但是,当我们想要对高维数据进行分类,又不清楚这个数据集有没有很好的可分性(即同类之间间隔小,异类之...
阅读全文
Machine Learning

t-SNE使用过程中的一些坑

几年前,我写过一个关于t-SNE原理的介绍博客,在日常的工作中,涉及到数据可视化的时候一般都会想到去使用这个工具。但是使用归使用,大部分人却很少去思考为什么要用t-SNE,怎样“正确”的使用t-SNE...
阅读全文
Bioinformatics

快速入门GATK

GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因...
阅读全文
Single Cell

单细胞测序教程

小伙伴们,大家好,今天我们来开启一个新的话题,Single cell sequence,近来单细胞测序在探索生物过程、疾病机理等方面展现了前所未有的精度,通过对单细胞进行 DNA 和 RNAseq 我...
阅读全文