Trimmomatic 质控
发布网友
发布时间:2023-05-05 14:40
我来回答
共1个回答
热心网友
时间:2023-11-14 20:28
每条reads长度为150bp,通过换算将原始数据缩减,然后质控到6G左右。
其中seqtk截取数据,head等提取reads数目;
1、去除adapter序列以及测序中其他特殊序列;
2、采用滑动窗口的方法,切除或者删除低质量碱基;
3、去除头部低质量以及N碱基过多的reads;
4、去除尾部低质量以及N碱基过多的reads;
5、截取固定长度的reads;
6、丢掉小于一定长度的reads;
7、Phred 质量值转换
Trimmomatic 过滤数据的步骤与命令行中过滤参数的顺序有关,通常的过滤步骤如下:
每一步的过滤如果需要多个参数,通常用冒号:将各个参数隔开,当然参数的先后顺序是有要求的。
ILUMINACLIP
从名字可以看出,这一步是为了去除 illumina 接头的,这个软件其实就是专为 illumina 平台数据而设计的。
PE 模式的两个输入文件:sample_R1.fastq sample_R2.fastq以及四个输出文件:sample_paired_R1.clean.fastq sample_unpaired_R1.clean.fastq sample_paired_R1.clean.fastq sample_unpaired_R1.clean.fastq
网上搜索到一个图片展示:
详细可参考8种特殊建库测序 https://www.cnblogs.com/think-and-do/p/6613719.html
常见报错信息:
1.接头文件未识别或者不对应;
2.原始文件抽取bug----下机数据足够,抽取显示数据不足
3.文件抽取失败;
4.服务器运行故障;
遇到1,2问题,结果文件夹中会出现部分结果,但是没有clean_data文件或者数据量不足(常见于2),这时候需要把该样本跑出的结果删掉再重新跑;
遇到3,4问题,一般是该样本未顺利进行,结果文件夹中也没有对应的文件,重置task在运行即可。
后面会根据raw_data(缩减后)--clean_data的数据,展示质控前后数据质量的变化。fastp软件详解见 https://www.jianshu.com/p/642890df29e5
热心网友
时间:2023-11-14 20:28
每条reads长度为150bp,通过换算将原始数据缩减,然后质控到6G左右。
其中seqtk截取数据,head等提取reads数目;
1、去除adapter序列以及测序中其他特殊序列;
2、采用滑动窗口的方法,切除或者删除低质量碱基;
3、去除头部低质量以及N碱基过多的reads;
4、去除尾部低质量以及N碱基过多的reads;
5、截取固定长度的reads;
6、丢掉小于一定长度的reads;
7、Phred 质量值转换
Trimmomatic 过滤数据的步骤与命令行中过滤参数的顺序有关,通常的过滤步骤如下:
每一步的过滤如果需要多个参数,通常用冒号:将各个参数隔开,当然参数的先后顺序是有要求的。
ILUMINACLIP
从名字可以看出,这一步是为了去除 illumina 接头的,这个软件其实就是专为 illumina 平台数据而设计的。
PE 模式的两个输入文件:sample_R1.fastq sample_R2.fastq以及四个输出文件:sample_paired_R1.clean.fastq sample_unpaired_R1.clean.fastq sample_paired_R1.clean.fastq sample_unpaired_R1.clean.fastq
网上搜索到一个图片展示:
详细可参考8种特殊建库测序 https://www.cnblogs.com/think-and-do/p/6613719.html
常见报错信息:
1.接头文件未识别或者不对应;
2.原始文件抽取bug----下机数据足够,抽取显示数据不足
3.文件抽取失败;
4.服务器运行故障;
遇到1,2问题,结果文件夹中会出现部分结果,但是没有clean_data文件或者数据量不足(常见于2),这时候需要把该样本跑出的结果删掉再重新跑;
遇到3,4问题,一般是该样本未顺利进行,结果文件夹中也没有对应的文件,重置task在运行即可。
后面会根据raw_data(缩减后)--clean_data的数据,展示质控前后数据质量的变化。fastp软件详解见 https://www.jianshu.com/p/642890df29e5