Machine Learning一维数组的聚类 在学习聚类算法的过程中,学习到的聚类算法大部分都是针对n维的,针对一维数据的聚类方式较少,今天就来学习下如何给一维的数据进行聚类。 方案一:采用K-Means对一维数据聚类 Python代码如下: f... 05月18日 1,886 评论 阅读全文
StatisticsFine-Gray检验与竞争风险模型 题记:本文主要介绍生存资料处理的Fine-Gray检验与竞争风险模型,在生存资料处理中,这种方法目前应用越来越广泛。 1. 背景知识 在观察某事件是否发生时,如果该事件被其他事件阻碍,即存在所谓“竞争... 05月17日 2,323 评论 阅读全文
Statistics生存分析中连续型自变量截断值的确定方法 题记:本文重点讲解在生存分析中如何合理设置连续型自变量的截断值,将连续型自变量转换为二分类变量。 1. 背景知识 对于结果变量为二分类资料的数据,连续型自变量截断值的确定一般通过ROC分析,我们通常选... 05月17日 1,843 评论 阅读全文
Bioinformatics使用FGAP进行补洞 1. FGAP简介 FGAP利用BLAST将contigs序列比对到基因组草图序列上,寻找重叠到gap区间的最优序列,从而进行补洞。其参考文献:Piro, Vitor C., et al. “FGAP... 05月17日 803 评论 阅读全文
Bioinformatics使用 GCE 进行基因组大小评估 1. GCE 简介 GCE(Genome Characteristics Estimation) 是华大基因用于基因组评估的软件,其参考文献为:Estimation of genomic charac... 05月17日 6,218 1 阅读全文
Bioinformatics通过WIG格式将转录组数据展示到Gbrowse2中 1. WIG格式介绍 WIG格式(Wiggle Track Format),可用于将转录组数据进行可视化展示。bigWig格式则是WIG格式的二进制方式,可以使用wigToBigWig将WIG格式转换... 05月17日 1,760 评论 阅读全文
Bioinformaticsblast进行重复序列屏蔽 1. 构建数据库的时候屏蔽参考序列的重复 segmasker 屏蔽氨基酸的低复杂序列 dustmasker 屏蔽核算序列的低复杂序列 windowmasker 按照序列重复的次数来屏蔽 convert... 05月17日 1,919 评论 阅读全文
Machine Learning深入卷积神经网络背后的数学原理 【导读】在计算机神经视觉技术的发展过程中,卷积神经网络成为了其中的重要组成部分,本文对卷积神经网络的数学原理进行了介绍。 文章包括四个主要内容:卷积、卷积层、池化层以及卷积神经网络中的反向传播原理。在... 05月16日 602 评论 阅读全文
BioinformaticsFPKM/RPKM之外的那些标准化方法 目录 1. 标准化 1.1. House-keeping gene(s) 1.2. spike-in 1.3. CPM 1.4. TCS 1.5. Quantile 1.6. Median of Ra... 05月16日 1,177 评论 阅读全文
Bioinformatics使用SignalP对蛋白序列进行信号肽预测 1. 信号肽简介 信号肽是蛋白质N-末端一段编码长度为5-30的疏水性氨基酸序列,用于引导新合成蛋白质向通路转移的短肽链。信号肽存在于分泌蛋白、跨膜蛋白和真核生物细胞器内的蛋白中。 信号肽指引蛋白质转... 05月16日 4,308 评论 阅读全文