动植物重测序--全基因组关联分析GWAS
发布网友
发布时间:2022-10-08 20:22
我来回答
共1个回答
热心网友
时间:2023-12-09 21:24
GWAS(Genome-wide association study)是对遗传多样性丰富的自然群体的每个个体进行基因组测序,结合目标性状的表型数据,基于一定的统计方法进行全基因组关联分析,可以快速获得影响目标性状表型变异的染色体区段或基因位点。
当然,GWAS可以应用于人的表型分析,这里暂时先说动植物的。
GWAS已经发表的物种:玉米水稻拟南芥大豆毛果杨番茄果蝇白虎疟原虫等,物种很丰富。因为不需要构建家系群体,像BSA遗传图谱还得杂交自交,作物植物之类的只杂交养大就得小半年时间,GWAS就直接采集自然群体就好也可以多地采样,这样变异范围广一些,做出来的结果适用性也比较强;其次就是一次性可以定位多个性状,基本是唯一的一个用于自然样本性状定位的分析方法;定位精度也高,可以直接获得与目标性状相关的基因。
①样本选择:自然群体,可以多品种多地域取样,原则上样本间不能有明显的亚群分化(例如生殖隔离等)即遗传背景差异小,如果样本间存在亚群分化,则每个亚群建议样本量在200个以上;
②样本数量:≥300个个体,每种性状能记录到表型的植株数尽量保证在200株以上;
③测序策略:有参选择WGS,无参选择简化基因组,测序数据量10x,如果样本数量很多500个样本以上,测5x即可。
※※另外非常重要的一点, 前期对采集样本的表型记录一定要准确详细 ,因为分析中要用到表型数据所以表型的记录也会对分析结果产生影响,原因:每次计算为单表型 GWAS 分析,在当前表型中,缺失样本不参与此次分析,导致有效个体数目减少;GWAS 通过统计模型找出影响表型差异的 SNP 及基因,记录不准确的话,可能会导致找到的SNP 或基因有很大的假阳性。
表型选择:生育期 叶子果实大小 枝茎长短弯曲程度 花瓣果实品质含糖量 抗病抗虫抗逆性,除此之外,基因的表达量也可作为表型分析叫做eWAS,代谢物类型也可叫做mWAS,只有想不到没有做不到。
分析流程其他软文有很多讲过的,我就不班门弄斧了,我把链接放在文末供参考。
1、家系样本是否可以进行 GWAS 分析?
通常禽类研究选择半同胞家系(由同父异母或异父同母所生子女的集合体成为半同胞家系)或全同胞家系(由同父同母所生子女的集合体称为全同胞家系)。理论上,其他动物也可以选择表型多样性丰富的家系样本进行GWAS 研究, 优先推荐选用 F2代群体。如果老师的 F2 代群体样本数少,也可以将 F1 代和 F2 代作为一个研究群体,在后续GWAS 分析过程中会有 KINSHIP(亲缘关系矩阵)去校正模型。
2、是否 GWAS 样本的表型分布必须呈现正态分布?
对于数量性状所选择的个体,在表型上尽量呈正态分布;若无法取到完全正态分布的样本的性状, 针对该类性状,在后续分析过程中采用非正态分布性状的分析方法对其进行校正,以保证分析结果的可靠性。
3、是否一定要超过 200 个样本才能进行 GWAS 分析?
基于 GWAS 文章中的样本数和我们的项目经验,推荐选取 200 个以上的样本,以尽可能保证分析结果的可靠性。但是对于一些珍稀的物种研究,材料相对稀少且难以获得,如老虎,熊猫,金丝猴等,可适当减少样本个数。 如果研究内容是由单基因控制的性状,其实材料少也可以得到不错的结果。但如果是复杂性状,少量样本的关联分析结果不可信。
4、如何降低分析结果的假阳性?
在全基因组关联分析中,前期对样本的采集情况(表型分布均匀,环境一致)会对后续分析的假阳性结果存在最大的影响,在分析过程中会采用如下方法降低分析结果的假阳性:a)结合群体分层信息,利用混合线性模型,对结果进行校正; b)必要时还会采取多种线性模型进行分析降低假阳性;c)采用 Bonferroni 校正法来校正 GWAS 分析中多重假设检验后的 P 值可以降低假阳性的概率。因此,前期对样品的采集及表型的记录需要准确详细。
5、得到的结果如何验证?
a)已发表的本物种或相近物种的QTL或基因比较分析;b)若没有已发表的,可通过家系群体QTL分析进行验证;c)结合转录组或者表达谱分析,验证相关区域或者位点*的通路信息。
参考学习:
1、 全基因组关联分析 (GWAS) - 简介
2、 全基因组关联分析学习资料(GWAS tutorial)
动植物重测序--全基因组关联分析GWAS
GWAS(Genome-wide association study)是对遗传多样性丰富的自然群体的每个个体进行基因组测序,结合目标性状的表型数据,基于一定的统计方法进行全基因组关联分析,可以快速获得影响目标性状表型变异的染色体区段或基因位点。当然,GWAS可以应用于人的表型分析,这里暂时先说动植物的。GWAS已经发表的物种:玉米...
环状RNA合成公司哪家好?
作为广州吉赛生物科技股份有限公司的工作人员,我们深知环状RNA合成技术的复杂性和专业性。在环状RNA合成领域,有多家公司均表现出色,各自拥有独特的技术优势和丰富的行业经验。然而,要评价哪家公司,需要考虑多方面的因素,如技术创新能力、产品质量、客户反馈等。广州吉赛生物科技股份有限公司也在此领域有着深入的研究和丰富的经验,我们致力于为客户提供高质量的环状RNA合成服务。因此,选择环状RNA合成公司时,建议客户根据自身需求和实际情况进行综合评估,选择最适合自己的合作伙伴。环状RNA因独特的闭环结构而稳定性更强,作为线性mRNA的有效替代品,是下一代基因治疗开发的理想平台。吉赛生物拥有原创的环化专利技术,可实现RNA高效环化,制备的circRNA完整性好、纯度高、翻译表达能力强,可用于细胞转染、动物实验、药效评估...
2021-01-27林木全基因组关联分析(GWAS)研究进展与展望
1、全基因组关联分析(GWAS)是一种复杂性状功能定位的正向遗传学分析策略, 可直接利用群体内所有个体全基因组水平上的等位遗传变异和表型变异的相关性分析, 鉴定与目标性状显著连锁的等位变异位点,进而分析等位基因型对表型的遗传效应, 在植物数量性状遗传结构解析中取得了丰硕成果。2、LD水平决定了GWAS的解...
GWAS系列 | 带你读懂全基因组关联研究(一)
基因组的交响:分型与质控 微阵列和下一代测序技术(如WES和WGS)是这场研究的乐章。微阵列曾是主流,但随着WGS技术的普及,其全基因组覆盖性使其成为理想选择。在数据清洗阶段,严格的质量控制至关重要,包括剔除稀有变异,校正哈温平衡,处理缺失数据,以及确认基因分型的准确性。主旋律:关联分析与人...
1+1>2,GWAS+转录组联合分析,你一定要知道!
该研究对248个个体进行高深度的全基因组重测序,同时还收集了四种羊(短瘦尾、短脂尾、长脂尾和肥臀)12个个体的绵羊尾部脂肪组织进行 RNA-Seq 分析。通过全基因组选择分析和全基因组关联分析(GWAS),利用单核苷酸多态性(SNP)和拷贝数变异(CNV)分子标记,挖掘出 PDGFD 这个被共同选...
重测序-棉花GWAS助力Nature Genetics
2.13个纤维素相关性状的全基因组关联分析:GWAS共检测到11026个显著关联的SNP、4280个基因(基因——测序后会有相应的注释文件)。并且在转录组中,3089个基因具有较高的表达,可以分为四种模式,分别在发育起始、细胞延伸、和次生壁合成阶段优先表达,另一种模式在多少发育阶段都保持较高的表达水平。3....
菌株全基因组测序草图是到什么程度
回答:基于第二代高通量测序技术,对于有参考序列的物种,针对不同的真菌菌株,可通过全基因组重测序的方法获得全基因组范围内完整的变异信息,讨论群体的遗传结构、影响群体遗传平衡的因素以及物种形成的机制,定位重要性状位点,为后续分子育种打下坚实基础。同时,通过全基因组大样本重测序对真菌重要菌株进行全基因...
每周文献 2022-05-02
因此,作者在418份不同油菜种质的全基因组测序基础上,对育种过程中的油菜进行了全面的基因组评估。作者揭示了选择适应性和农艺性状的基因组基础。全基因组关联研究在56个重要农艺性状(包括植株结构和产量性状)鉴定了628个关联位点相关的致病候选基因。此外,作者发现农艺性状的可能候选基因中存在非同义突变...
研究全集因组关联分析的前提是什么,是否需要已知基因组测序?
全基因组关联分析(Genome-wide association study;GWAS)GWAS的具体研究方法与传统的候选基因法相类似。最早主要是用单阶段方法,即选择足够多的样本,一次性地在所有研究对象中对目标SNP进行基因分型,然后分析每个SNP与目标性状的关联,统计分析关联强度。目前GWAS研究主要采用两阶段或多阶段方法。在第一...
如何根据基因测序分析结果找通路
3、亚洲棉的全基因组关联分析(GWAS):对来自不同环境下的11个重要性状进行全基因组关联分析,鉴定了亚洲棉11个重要农艺性状的98个显著关联位点,GaKASIII的非同义替换(半胱氨酸/精氨酸替换)使得棉籽中的脂肪酸组成(C16:0和C16:1)发生了变化;发现棉花枯萎病抗性与GaGSTF9基因的表达激活相关。选择...
分子育种重测序应用方案
利用WGS或者简化基因组都可进行GWAS分析,但简化基因组的精度肯定会差些:华大把以上内容归到一个产品里,即动植物全基因组重测序,作为一个标准分析流程,该分析的内容都含有,其他的就要结合研究目的采用不同的取样、建库和测序策略了。主要分析内容: 变异检测 :