RNA-seq(7): DEseq2筛选差异表达基因并注释(bioMart)
发布网友
发布时间:2023-04-22 09:43
我来回答
共1个回答
热心网友
时间:2023-10-19 01:05
============================================
写在前面:可以参考另外一篇《 得到差异基因后怎么做? 》
============================================
显示为
接下来,我们要查看treat versus control的总体结果,并根据p-value进行重新排序。利用 summary 命令统计显示一共多少个genes上调和下调(FDR0.1)
差异表达基因的界定很不统一,但log2FC是用的最广泛同时也是最不精确的方式,但因为其好理解所以广泛被应用尤其芯片数据处理中,记的是havard universit做过一个统计,FC=2相对比较可靠。但无论怎么,这种界定人为因素太大,过于武断。所以GSEA,WGCNA是拿全部表达数据(可以进行初步过滤)来进行分析,并且WGCNA采取软阈值的方式来挑选genes更加合理。既然挑选差异表达基因,还是采取log2FC和padj来进行。
结果显示如下:
合并的话两个数据必须有共同的列名,我们先看一下
可见,两个文件没有共同的列名,所以要先给'diff_gene_deseq2'添加一个‘ensembl_gene_id’的列名,方法如下:(应该有更简便的方法)