直接iprscan是不行的,需要加个-cli才能正常运行,不然出现一大堆HTML的代码,这里的cli 是command-line interface 简写。 usage: ./iprscan -cli...
使用mamba加快conda安装软件速度
conda 是⼀个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。但是使用conda时经常会发现安装很慢,除了最基本的网络问题可以换成国内镜像来解决,c...
Cell Ranger 输出文件介绍
利用cell ranger分析scRNA-Seq数据后一般会得到这三个文件, barcodes.tsv.gz # 每个barcode代表一个cell features.tsv.gz # 每个feat...
Linux命令解释工具
很多同学刚接触生物信息的时候,对linux的命令多少存在一些恐惧和障碍。不知道为什么要敲这一对命令,他们的参数是什么意思。这里跟大家分享一个有趣的linux命令学习网站。它能够帮助大家很好地去理解li...
各种染色体元件鉴定方法比较
最近有人问我关于ATAC-Seq与ChIP-Seq的区别。刚好在分析ATAC-Seq和DNase-Seq的数据,于是做了个简单介绍。在六六_ryx的博客里面看到下面的介绍,做了简单修改放在这里跟大家分...
深度学习参数优化和训练技巧总结
寻找合适的学习率(learning rate) 学习率是一个非常非常重要的超参数,这个参数呢,面对不同规模、不同batch-size、不同优化方式、不同数据集,其最合适的值都是不确定的,我们无法光凭经...
Python画图系列教程
对于从事生物信息的人来说Python是一个非常强大的数据处理和分析的语言。初步处理完数据后,对于数据可视化,不少同学选择用R来画图,譬如强大的ggplot2系列的包。PLoB也建立专栏索引列出了ggp...
快速图文理解卷积神经网络(CNN)
一、引子————边界检测 我们来看一个最简单的例子:“边界检测(edge detection)”,假设我们有这样的一张图片,大小8×8: 图片中的数字代表该位置的像素值,我们知道,像素值越大,颜色越亮...
机器学习之特征选择(Feature Selection)
1 引言 特征提取和特征选择作为机器学习的重点内容,可以将原始数据转换为更能代表预测模型的潜在问题和特征的过程,可以通过挑选最相关的特征,提取特征和创造特征来实现。要想学习特征选择必然要了解什么是特征...
R语言画图、数据分析、机器学习快速参考手册
在做生物信息数据分析中,R的使用是非常普遍。利用R来做数据处理和画图几乎是家常便饭。这里跟大家分享各种R package使用手册的简要版手卡,其中包括ggplot画图、R中数据操作、机器学习等等。下面...