前言 基因测序已是时下热门,目前除了华大基因之外,其他分布于全中国的大型测序平台(HiSeq X 10)还有约10个,每个每年大概能完成1.8万人的高深度全基因组测序,加起来就是18万人,如果加上华大...
使用Shapeit2对人类基因组数据进行phasing
SHAPEIT(2.0)是专门用于对推断基因组单体型的软件,有牛津大学的团队所开发,并且一直应用与千人基因组计划中。 以下,我将记录如何通过shapeit2对人群的变异数据集(VCF 格式)进行pha...
转录组入门(2):读文章拿到测序数据
本系列课程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commu...
RNA-seq数据综合分析教程
2 RNA-seq数据分析 mRNA-seq是目前最常用的高通量测序技术,一般的用法就是看看基因表达谱,寻找差异表达的基因。我和高通量测序数据分析结缘,也是因为RNA-seq。 一开始我对mRNA-s...
tfrecords 格式数据训练mnist
TFRecords是tensorflow存储数据的一种二进制文件,能更好的利用内存,更方便复制和移动,并且不需要单独的标签文件,类似于caffe中的LMDB和LvevelDB,极大的提高了IO吞吐。 ...
基于RNA-Seq的转录组数据分析入门介绍
基于RNA-Seq的转录组数据分析已经在研究中运用了近10来年了,现在一些杂志在发表论文的时候reviewers已经倾向于用RNA-Seq来替代RT-qPCR。对于生物信息专业“干实验”...
深度学习中的数据增强、backbone、head、neck、损失函数(loss function)术语解释和汇总
backbone:主干网络,用来提取特征,常用Resnet、VGG等 head:获取网络输出,利用提取特征做出预测 neck:放在backbone和head之间,进一步提升特征的多样性及鲁棒性 bot...
深度学习数据集最常见的6大问题(附解决方案)
简介 如果您还没有听过,请告诉您一个事实,作为一名数据科学家,您应该始终站在一个角落跟你说:“你的结果与你的数据一样好。” 尝试通过提高模型能力来弥补糟糕的数据是许多人会犯的错误。这相当于你因为原来的...
Seaborn(sns)官方文档学习笔记(第六章 绘制数据网格)
Seaborn(sns)官方文档学习笔记系列包括: 第一章 艺术化的图表控制 第二章 斑驳陆离的调色板 第三章 分布数据集的可视化 第四章 线性关系的可视化 第五章 分类数据的绘制 第六章 绘制数据网...
Seaborn(sns)官方文档学习笔记(第五章 分类数据的绘制)
Seaborn(sns)官方文档学习笔记系列包括: 第一章 艺术化的图表控制 第二章 斑驳陆离的调色板 第三章 分布数据集的可视化 第四章 线性关系的可视化 第五章 分类数据的绘制 第六章 绘制数据网...