2021-01-27林木全基因组关联分析(GWAS)研究进展与展望
发布网友
发布时间:2022-11-30 11:29
我来回答
共1个回答
热心网友
时间:2023-11-04 09:13
1、林木目标改良性状多为数量性状,受全基因组水平多基因位点联合控制,其遗传变异效应可分为基因的加性和显性效应、基因-基因的上位性效应以及基因-环境的互作效应等。先前基于家系群体的数量性状位点定位分析方法的应用,在林木复杂性状遗传解析方面取得了显著进展。
2、但由于林木家系作图大多基于F1, F2或BC1等低世代杂交群体, 遗传变异丰富度较低和染色体重组事件有限, 导致QTL作图分辨率低且其遗传效应往往被高估。
3、基于自然群体或种质资源群体的关联遗传学(association genetics)策略的提出, 为解析数量性状的遗传基础提供了新的途径。
4、关联分析又称连锁不平衡(linkage disequilibrium,LD)作图,可以直接利用自然群体中丰富的表型和基因组变异来确定控制数量性状的目标基因。特别是多年生林木群体在适应复杂多变的自然环境过程中产生了丰富的表型变异和DNA序列变异,是开展关联作图研究的理想材料。
5、根据遗传变异来源, 关联作图可分为基于候选基因(candidate gene-based association study)和基于全基因组(genome-wide association study, GWAS)的两种分析方法。
6、随着NGS的发展,基于全基因组重测序(whole genome resequencing)和简化基因组测序(reced-representation genome sequencing, RRGS)技术确定了海量的覆盖全基因组水平的SNP变异位点, 显著推动了林木GWAS策略的广泛应用。此外, 第二代测序技术也促进了全基因组范围内插入缺失(insertion/deletion, InDel)、拷贝数变异(copy number variation, CNV)等标记位点的开发与应用, 弥补了仅考虑SNP导致的数量性状“丢失遗传力”。
1、全基因组关联分析(GWAS)是一种复杂性状功能定位的正向遗传学分析策略, 可直接利用群体内所有个体全基因组水平上的等位遗传变异和表型变异的相关性分析, 鉴定与目标性状显著连锁的等位变异位点,进而分析等位基因型对表型的遗传效应, 在植物数量性状遗传结构解析中取得了丰硕成果。
2、LD水平决定了GWAS的解析精度, 是开展GWAS研究的理论基础, 它代表了基因组中两个等位基因非随机组合的程度, 主要产生于群体进化过程中的突变和重组事件, 也会受到群体大小、异交率、选择强度与遗传漂变等其他因素的影响。一般来说, 林木群体内LD在500~2000 bp内已衰退至不明显。遗传漂变可导致毛果杨(Populus tricho�carpa)自然群体的基因组区域LD衰退范围达到3~6 kb,而且在着丝粒区及基因密度较低的染色体区段, LD衰退距离更远。林木进化过程主要受到自然选择的作用, 与受到强烈人工驯化的一年生作物相比,多年生林木的LD水平相对较低, 因此, 当一个与性状显著关联的遗传标记一旦被发现和验证, 则该标记与功能位点物理距离很近甚至是功能变异基因本身, 上述研究对于未来林木分子辅助育种提供了重要的理论指导。
林木关联分析的研究主要针对木材品质和产量等重要的经济性状,以及物候相关的适应性性状。
由于GWAS在复杂性状遗传基础研究中的优势,其在动植物遗传学研究中的应用越来越广泛, 新的软件和方法也不断被开发, 功能和算法也各不相同, 但多数是以 一般线性模型(general linear model, GLM) 和 混合线性模型(mixed linear model, MLM) 为基础。
一般线性模型 以 群体结构矩阵(population structure, Q) 或 主成分分析(principal component analysis, PCA)矩阵 为协变量, 提高计算精度。
混合线性模型 联合利用 Q矩阵 和 亲缘关系(kin-ship, K)矩阵 或者联合利用 PCA矩阵 和 K矩阵 为协变量开展关联作图分析。
GWAS研究主要的软件及其功能特点如下表:
TASSEL、PLINK、EMMAX软件是林木中应用比较广泛的单标记GWAS分析软件。
a 、TASSEL软件功能较为全面, 但计算效率较低。
b 、PLIKN软件在数据管理和群体结构评价方面较为简单、高效, 但是其关联结果质量相对较差。
c 、EMMAX软件用到了运算速度较快的有效混合模型关联分析算法, 在对大样本数据处理上具有更高的效率。
上述三款软件主要应用于单标记位点的GWAS研究工作,确定的都是宜穿效应较为显著的单标记位点,在林木数量性状受到的多基因多位点联合控制。因此, 开发使用多位点GWAS关联模型进行遗传效应分析, 可以检测更多的联合遗传位点, 进而更清晰地剖析出目标性状的基因组遗传结构。
例如,mrMLM软件可以将SNP效应视为随机效应并利用多位点随机效应的MLM模型进行GWAS分析, 该模型有效提升了目标性状基因组遗传结构的解析精度。随着测序技术和组学技术的发展,大量的SNPs, InDels与CNVs标记等被广泛应用于林木复杂性状的遗传效应解析。因此, 开发适用于不同群体类型、不同标记类型、不同表型层次的GWAS软件,将会极大地推动林木复杂性状研究进展。
GWAS策略与多组学技术的结合已广泛应用于数量性状遗传解析。 GWAS联合多组学解析策略不仅可以提高筛选候选基因的准确性, 还可揭示复杂性状形成的分子遗传*机制。
近年来, 研究人员利用GWAS策略在动植物数量性状研究中鉴定了大量关键位点, 但是这些显著关联位点, 仅能解释部分表型变异, “ 丢失遗传力” 问题依然是当前数量遗传学研究的难点。因此,如图所示,本文从高通量表型组学、不同变异类型的遗传效应、加性与非加性联合解析策略等方面探讨, 为系统解析林木复杂性状, 解决“丢失遗传力”问题提供重要的策略指导。
基因型(genotype)、表型(phenotype)、环境(envir�onment)三者构成了GWAS研究的支撑要素。
林木群体内基因组内存在大量稀有等位变异位点, 这些位点独立起作用时对群体性状变异贡献率较低, 其遗传效应在种质资源或天然群体大的群体背景下难以被发现,而且通过建立林木多世代回交群体来改变稀有等位位点的频率是难以实现的。
..............................未完待续................................
2021-01-27林木全基因组关联分析(GWAS)研究进展与展望
1、全基因组关联分析(GWAS)是一种复杂性状功能定位的正向遗传学分析策略, 可直接利用群体内所有个体全基因组水平上的等位遗传变异和表型变异的相关性分析, 鉴定与目标性状显著连锁的等位变异位点,进而分析等位基因型对表型的遗传效应, 在植物数量性状遗传结构解析中取得了丰硕成果。2、LD水平决定了GWAS的解...
全基因组关联分析应用前景
全基因组关联分析(Genome-Wide Association Study,GWAS)作为一种强大的研究工具,正在引领我们探索复杂疾病背后的奥秘。通过在患者全基因组范围内对单核苷酸多态性(Single Nucleotide Polymorphism,SNP)位点与对照组进行深入比较,GWAS消除了传统候选基因策略中预先假设致病基因的局限性。这种方法的优势在于,...
全基因组关联分析的应用前景
GWAS为人们打开了一扇通往研究复杂疾病的大门,将在患者全基因组范围内检测出的SNP位点与对照组进行比较,找出所有的变异等位基因频率,从而避免了像候选基因策略一样需要预先假设致病基因。同时,GWAS研究让我们找到了许多从前未曾发现的基因以及染色体区域,为复杂疾病的发病机制提供了更多的线索。
GWAS 全基因组关联分析有哪些优点和缺点?
全基因组关联分析:揭示疾病的基因密码,挑战与机遇并存 全基因组关联研究(GWAS),如同生物医学领域的探索者,通过大规模样本分析,揭示了基因与疾病之间的微妙联系。它在糖尿病、心血管疾病等领域发挥着关键作用,推动了个体化医疗和药物研发的前沿。曼哈顿图和Q-Q图,两大解读神器,一展SNP关联的显著性...
全基因组关联分析研究历史
2005年,一项里程碑式的科学发现被Science杂志报道,首次揭示了与年龄相关的黄斑变性与基因组的关联,拉开了全基因组关联分析(GWAS)研究的序幕[1]。随后,GWAS的研究领域不断扩大,涉及到了心脏病的研究,如关于冠心病的关联分析[2],揭示了遗传因素在疾病发展中的重要作用。肥胖症也成为GWAS关注的焦点,...
动植物重测序--全基因组关联分析GWAS
GWAS(Genome-wide association study)是对遗传多样性丰富的自然群体的每个个体进行基因组测序,结合目标性状的表型数据,基于一定的统计方法进行全基因组关联分析,可以快速获得影响目标性状表型变异的染色体区段或基因位点。当然,GWAS可以应用于人的表型分析,这里暂时先说动植物的。GWAS已经发表的物种:玉米...
文献带读 | 全基因组关联研究(GWAS):复杂疾病相关的遗传因素的研究方法...
在《中华流行病学杂志》2021年第1期的“创刊40周年”特辑中,有一篇名为《大数据时代的流行病学研究:机遇、挑战与展望》的文章,小卫带读聚焦于全基因组关联研究(GWAS)这一研究热点。GWAS是一种探索复杂疾病遗传因素的有力工具,它通过大规模基因组分析,揭示了众多与人类复杂特征和疾病相关的基因关联...
GWAS分析(组学数据分析和信息挖掘)
GWAS分析,作为探索基因型与表型关联的关键工具,自2000年以来在遗传学研究中占据核心地位。它通过全基因组范围内检测SNPs与性状之间的关联,已揭示了众多统计显著的联系,对人类特征和疾病的遗传机制提供了深刻理解。然而,这种方法并非完美,存在局限性,如依赖连锁不平衡可能导致因果变异识别困难,且仅限于...
如何理解全基因组关联分析
用于确定等位变异对表型影响的大小,即表型变异解释率。然而,由于涉及大量SNP,GWAS处理的是多元回归问题,计算复杂且耗时。尽管GWAS在揭示基因与性状关联方面取得进展,但其仍有局限性,如模型效能、稀有变异的忽视等。为克服这些问题,研究者们不断优化方法和开发新的软件,持续改进全基因组关联分析技术。
GWAS和eQTL共定位分析
GWAS(全基因组关联分析)和eQTL(表达量单核苷酸多态性)是两种重要的遗传学研究方法,它们在探索基因与性状之间的关系中发挥着关键作用。GWAS通过分析大量个体的基因型与特定性状的关联,以识别与疾病或其他性状相关的遗传变异。而eQTL研究则关注特定基因座在不同个体间表达水平的差异,揭示基因表达变异与...