在机器学习或者深度学习领域,参数和超参数是一个常见的问题。 一直以来对于机器学习中的模型训练和模型选择存在一个误区,首先机器学习力的模型通俗来说就是一个函数关系,表明输入数据到输出数据的映射,基本的假...
Tensorflow一些常用基本概念与函数(1)
摘要:本文主要对tf的一些常用概念与方法进行描述。 1、tensorflow的基本运作 为了快速的熟悉TensorFlow编程,下面从一段简单的代码开始: import tensorflow as t...
Pytorch中的gradient_accumulate_steps、warmup、lr_decay、optimizer和scheduler等问题的解答
(一)gradient_accumulate_steps 对于模型训练来说,batch_size越大,模型效果会越好。但是某些环境下,没有足够的GPU来支撑起大的batch_size,因此这时可以考虑...
fasterq-dump使用介绍
之前写过一篇文章Fastq-dump使用, 详细介绍了fastq-dump的用法。 虽然fastq-dump参数很多,而且一直被吐槽参数说明写的太差,但是如果真的要用起来其实也就是一行代码 fastq...
关于RNA-Seq数据去接头(Adapter)
首先来了解一下三个概念: 1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。 2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不...
R语言聚类分析–cluster, factoextra
对于有很多(成百上千)研究对象时,把对象分组是最常用的研究手段。而通过观察值进行聚类是非常有效的方法,可以按事物观察值有效的合理分组,再进一步分析各组的相同、与不同,可以很好的发现其中的规律。 本文将...
深度学习中使用的batchsize, step(iteration), epoch 含义以及其关系
在深度学习中,常常会遇到batch size, step(iteration), epoch等词。对于很多新手不太清楚这些词之间的关系是什么。这里做一个简单介绍。 名词 定义和含义 epoch 一个e...
深度学习train loss 和 test loss的关系与作用
train loss 不断下降,test loss不断下降,说明网络仍在学习;(最好的) train loss 不断下降,test loss趋于不变,说明网络过拟合;(max pool, dropou...
如何“准确分析”事后多重比较(post hoc test)
基础准备 均值比较的假设检验是数据分析最重要的分析内容之一,根据参与比较的样本数量不同,使用的假设检验方法也不同,做个简要的总结: 一个总体均值与一个常数进行比较(Z检验和T检验); 两个总体均值之...
怎样在heatmap中使用多种cluster方法
生物信息学中经常使用R 来画图,而R画heatmap的功能是非常强大的。通常,我的习惯是使用gplots包中的heatmap.2函数来进行画图。不过这个函数中不能对聚类分析(clustering)到方...