问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何解读.gatkreport文件

发布网友 发布时间:2022-04-09 06:44

我来回答

2个回答

懂视网 时间:2022-04-09 11:05

GATK(Genome Analysis Toolkit)是美国Broad Institute研发的一套检测SNP(SNP calling)的流程。测序后的碱基质量由于测序过程中的物理化学反应和测序仪的瑕疵会导致碱基质量偏离真实情况,为了矫正碱基质量,BaseRecalibrator程序被开发出来。在碱基质量矫正过程中,已知的标准SNP数据库是非常重要的输入文件,例如人类的dbSNP数据库。但如果研究的基因组是一个比较新的物种,没有标准的SNP数据库的话,对碱基指令进行校正是否还可行?答案是仍有必要,这时应该利用现有数据模拟出一个标准SNP数据库来。下面转发GATK网站上的相关描述(原网址:https://software.broadinstitute.org/gatk/documentation/article?id=44)。

I‘m working on a genome that doesn‘t really have a good SNP database yet. I‘m wondering if it still makes sense to run base quality score recalibration without known SNPs.

The base quality score recalibrator treats every reference mismatch as indicative of machine error. True polymorphisms are legitimate mismatches to the reference and shouldn‘t be counted against the quality of a base. We use a database of known polymorphisms to skip over most polymorphic sites. Unfortunately without this information the data becomes almost completely unusable since the quality of the bases will be inferred to be much much lower than it actually is as a result of the reference-mismatching SNP sites.

However, all is not lost if you are willing to experiment a bit. You can bootstrap a database of known SNPs. Here‘s how it works:

  • First do an initial round of SNP calling on your original, unrecalibrated data.
  • Then take the SNPs that you have the highest confidence in and use that set as the database of known SNPs by feeding it as a VCF file to the base quality score recalibrator.
  • Finally, do a real round of SNP calling with the recalibrated data. These steps could be repeated several times until convergence.
  • 问题:我现在正在研究的基因组还没有一个好的SNP数据库,我想知道在没有已知的SNP的数据库的情况下还能否进行碱基质量矫正?

    回答:碱基质量分数矫正器会将每个与参考基因组错配的碱基都视为机器错误。真的多态性位点是合法的错配,因此不应该被算作是碱基质量的错误导致的错配。我们用已知的多态性位点数据库来跳过大部分的多态性位点。不幸的是,如果没有这个信息,数据将会变得完全不可使用,因为碱基的质量分数会被推测为远低于它作为一个与参考基因组错配的SNP位点实际应有的质量分数。

    然而,如果你愿意进行一个实验,碱基质量仍然能够被校正。你可以自己建立一个已知的SNP数据库。步骤如下:

    1.首先对你原始的、没有进行校正的数据进行一遍SNP calling.

    2. 然后选择那些你最有把握的SNP位点作为一个已知的SNP数据库,将其以VCF文件的形式传给碱基质量分数矫正器。

    3.最后,进行一次使用校正数据的、真正的SNP calling。这些步骤可以重复几次直到结果收敛。

    GATK的BaseRecalibration程序在无标准SNP数据库情况下,是否还能进行BaseRecalibration?

    标签:

    热心网友 时间:2022-04-09 08:13

    直接双击!点你要看的文件就可以了!
    或者双击打开 点解压缩!点确定
    然后在你存放该压缩文件的地方就会出现一个和这个压缩文件重名的文件夹!
    打开就看了!
    声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
    女生多大后可以不在长身高? 如何不用软件把手机投屏到电脑上手机屏幕怎样投放到电脑上 战时拒绝、故意延误军事订货罪既遂的处罚? 战时故意延误军事订货罪处罚标准 名师1+1导读方案:汤姆·索亚历险记目录 三星sm-g7200打开微信慢,无法正常收看,网速不慢。 笔记本电脑如何调亮屏幕亮度 大伙说说洗衣机要不要带烘干好 热烘干洗衣机怎么样 ef英语哪个好 高效过滤器的有效期是多少 如何理解高效过滤器相应好处及性能? 银行卡短信服务咋取消? 宁波银行怎么解除微信提醒啊 我国经济社会发展的“三步走”战略目标和“两个100年”目标分别是什么? 两个百年分别有什么奋斗目标? 人体视频人体网推荐给我 巴拉拉小魔仙互换身体是多少集? 视频 南瓜小米红枣葡萄干山楂可以一起煮嘛 山楂能和葡萄一起吃吗 葡萄和山楂可以一起吃吗 葡萄冬瓜南瓜鸡蛋一起吃有什么不良反应 南瓜吃多了有什么坏处 南瓜不能和什么一起吃 南瓜籽,葵瓜子、腰果,杏仁、枸杞子、葡萄可以一起吃吗? 南瓜子与葡萄干一起吃有什么坏处 葡萄干能和生南瓜籽一起吃吗 安全生产应该属于哪个部门 企业安全员回那个部门管? 安全员管消毒吗 安全员能不能干活 有专职安全员还需要施工员管安全吗 梦见蛇被活活杀死,预示什么 人类进入太空第一人是谁? 世界第一个登上太空的人是谁? 第一位飞上太空的地球人是 第一位飞上太空的地球人是(),第一位飞上太空的中国人是(),第一位进行太空漫步的中国人是(),第一 第一个登上太空的人是谁? 世界上第一名宇航员是谁? 到底谁才是进入太空的第一人? ()人()是人类历史上第一个在太空中飞行的宇航员 谁第一个上太空? 混合喷射和直喷哪个好?有什么区别? q5l40的混合喷射和45的缸内直喷发动机哪个先进 发动机混合喷射和直喷哪个好 混合喷射,直喷,多点喷射哪个好 直喷积碳多,为什么不用混合喷射 太阁立志传5GATK5修改器的使用方法 把生姜用榨汁机炸成姜汁,然后每天擦头,这样对头发有什么好处和坏事吗? hpc车牌是什么意思 车牌hpc是什么意思 车牌hpc832车牌怎么样?