Genomics从零开始完整学习全基因组测序(WGS)数据分析:第2节 FASTA和FASTQ 在WGS数据的分析过程中,我们会接触到许多生物信息学/基因组学领域所特有的数据文件和它们特殊的格式,在这一节中将要介绍的FASTA和FASTQ便是其中之一二。这是我们存储核苷酸序列信息(就是DNA序列... 02月27日16,6943fasta fastq 阅读全文
Bioinformatics生物信息常见文件的格式以及查看方式 生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式。在分析的过程中还会有众多中间文件的生成,如bed、bed12、... 04月29日6,938评论fasta fastq 阅读全文
Bioinformatics快速计算fasta序列长度的方法 最近看了一下进入PLoB的网页来路分析,看到有同学搜索计算fasta序列长度。其实自己在之前的数据分析中也遇到过相关的问题,这里给大家分享两种我常用的方法。 方法一:linux下用awk计算fasta... 10月03日14,1422bioperl 序列 阅读全文
ScriptBioperl:从本地文件中获取fasta序列 从NCBI上下载一个fasta格式的文件,20条WRKY家族基因的蛋白序列,wrky.fasta 文件准备好了,我们想知道它的名称、描述和序列内容!有了这些信息,我们就可以做别的事情,比如判断它是DN... 07月27日3,545评论bioperl perl 阅读全文
BioinformaticsPhd2Fasta 简介 Phd2fasta 是 phred\phrap 软件包的一部分,phred\phrap 软件包由华盛顿大学分子生物技 术学院的 Phil Green 和 Brent Ewing 开发,主要用于学... 07月04日1,894评论fasta 测序峰图 阅读全文
BioinformaticsDNA测序峰图转化成Phred格式 简介 Phred是 phred\phrap 软件包的一部分,phred\phrap 软件包由华盛顿大学分子生物技术学院的 Phil Green 和 Brent Ewing 开发,主要用于学术科研活动。... 07月04日3,561评论DNA 测序 阅读全文
Bioinformatics将比对好的fasta序列转换成relaxed phylip格式 有时,在推断进化树的过程中,我们希望phylip格式的文件能够将序列的名称完整得保留下来。通常情况下,我们的名称会超过10字符, 而ClustalX和MUSCLE等软件给出的phylip文件是严格的p... 02月23日5,6541 fasta R 阅读全文
GenomicsDNA各种序列格式介绍 1.Plain格式 A sequence in plain format may contain only IUPAC characters and spaces (no numbers!). Not... 12月18日7,215评论DNA fasta 阅读全文
BioinformaticsFASTX-Toolkit FASTX-Toolkit是一款用于处理Short-Reads FASTA/FASTQ文件的程序,里面包含了丰富的FASTA/FASTQ文件格式转换、统计等命令。 下面是其功能介绍: FASTQ-t... 11月30日8,990评论fasta fastq 阅读全文
GlossaryFasta格式说明 序列的Fasta格式是最经常看到的格式之一。下面简介说明一下什么是FASTA格式。 Fasta格式开始于一个标识符:">",然后是一行描述,下面是一行行的序列。每一行最好不要超过80个字母。 如... 11月23日4,322评论fasta sequence 阅读全文