发布网友 发布时间:2022-09-21 08:41
共1个回答
热心网友 时间:2023-11-16 00:56
RNA-seq即 转录组测序 技术,就是用 高通量测序 技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等或者其中一些的表达水平。RNA测序最经常用于分析差异表达基因(DEG)。
转录组 是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及 基因结构 ,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。
gene:具有编码蛋白质或决定某一性状作用的一段核酸序列。
Q20,Q30:Phred 数值大于 20、30 的碱基占总体碱基的百分比,其中
Phred=-10log10(e).
intron:内含子,是真核生物细胞 DNA 中的间插序列。这些序列被
转录在前体 RNA 中,经过剪接被去除,最终不存在于成熟 RNA 分
子中。术语内含子也指编码相应 RNA 内含子的 DNA 中的区域。
exon:外显子,是真核生物基因的一部分,它在剪接(Splicing)后仍会被保存下来,并可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟 RNA 中的基因序列,又称表达序列。既存在于最初的转录产物中,也存在于成熟的 RNA 分子中的核苷酸序列。术语外显子也指编码相应 RNA 外显子的 DNA 中的区域。
intergenic:基因间区,指基因与基因之间的间隔序列,不属于基因结构,不直接决定氨基酸,可能通过转录后*影响性状的区域。
UTR:Untranslated Regions, 非翻译区域。是信使 RNA(mRNA)分子两端的非编码片段。5'-UTR 从 mRNA 起点的甲基化鸟嘌呤核苷酸帽延伸至 AUG 起始密码子,3'-UTR 从编码区末端的终止密码子延伸至多聚 A 尾巴(Poly-A)的前端。
transcript:转录本,是由一条基因通过转录形成的一种或多种可供编码蛋白质的成熟的 mRNA。一条基因通过内含子的不同剪接可构成不同的转录本。
isoform:同一个基因经可变剪切或内含子选择机制产生不同的转录本,这些不同转录本即称 isoform。 reconstruction:重组,由于不同 DNA 链的断裂和连接而产生 DN*段的交换和重新组合,从而形成新 DNA 分子。plus strand/minus strand:正链/负链。对于一个基因来说,DNA 的两条链中有一条链作为 RNA 合成时的模板,这条链叫负链,另一条叫正链。
antisense strand/sense strand:无义链/有义链。模板链在双链 DNA中,用来转录 mRNA 的 DNA 链称为模板链(template strand),不用于转录的链则称为非模板链(nontemplate strand)。根据碱基互补配对原则,转录出的 mRNA 链的碱基序列与非模板链的碱基序列一致,惟一不同的是,非模板链中的 T 在 mRNA 链中全部置换成了 U。正是由于非模板链的碱基序列实际上代表了 mRNA 的碱基序列(只不过在 mRNA 中 T 换成了 U),因此非模板链又被称为编码链(coding strand),有义链(sense strand)和克里克链(crick strand),而用来转录mRNA 的 DNA 链被称为非编码链(anticoding strand)或无义(antisense strand)或沃森链(watson strand)。
gene family:基因家族。真核细胞中,许多相关的基因常按功能成套组合,被称为基因家族。它们来源于同一祖先,由一个基因通过基因重复产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。
gtf/gff:基因结构注释文件。gtf(gene transfer format)指包含基因特
征的注释文件,而 gff(general feature format)是指包含基因组特征
的注释文件。
ORF:open reading frame,开放阅读框或开放读码框。是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的
多肽链,其间不存在使翻译中断的终止密码子。
reference genome/ reference:参考基因组。RNA-seq 有参分析的基础。
small RNA:是长度大约在 18-30bp 的非编码 RNA 分子,包括 micro RNAs、siRNAs 和 pi RNAs,是生命活动重要的*因子,在基因表达*、生物个体发育、代谢及疾病的发生等生理过程中起着重要作
用。
ncRNA:non-coding RNA,非编码 RNA。指不编码蛋白质的 RNA。其中包括 rRNA,tRNA,snRNA,snoRNA 和 microRNA 等多种已知功能的 RNA,及未知功能的 RNA。其共同特点是都能从基因组上转录而来,不需要翻译成蛋白即可在 RNA 水平上行使各自的生物学功能。
lncRNA:long noncoding RNA,长链非编码 RNA。长度在 200-100000nt之间,不具有编码蛋白功能的转录本。根据与编码基因的位置关系可分为:Antisense lncRNA (反义长非编码 RNA)、Intronic lncRNA (内含子长非编码 RNA)、Long intergenic noncoding RNA (基因间区长非编码 RNA)、Sense lncRNA(正义长非编码 RNA)、Bidirectional lncRNA(双向长非编码 RNA)。
参考链接:
RNA-seq_百度百科 (.com)