为什么要在R中进行ID转换 在转录组数据或者其他分析中,好吧,其实是因为我做的物种是家鸡,根本就没有人和鼠那样有着非常完善和时刻更新的数据库做为支持,我经常会遇见GeneID转换,同源基因转换的问题,之前一直利用Ensembl主页里面的biomart进行数据下载,然后在excel里面利用vlookup进行操作,哎,费时费力,而且不能高度自动化和重复化~~(传统湿实验室人员的基本操作思维)~~,现在已经开始将大部分操作都在R里面进行了,刚好学习了biomaRt包可以完美替代之前的操作流程,下面就是相关笔记及备注:
好吧,这是第一篇Rmd笔记,Rmarkdown真的超级好用啊!
安装所需的软件包 下面的R包也包括Y叔的clusterProfiler了,里面也有ID转换的板块,也是非常实用的,一并汇总了。
if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("biomaRt") biomaRt示例 首先还是推荐看官方文档,没有什么攻略比官方文档更靠谱了,除非懒~
library("biomaRt") library(org.Gg.eg.db) library(org.Hs.eg.db) library(clusterProfiler) library(DOSE) # 查看Marts库 listMarts(host="asia.ensembl.org") ## biomart version ## 1 ENSEMBL_MART_ENSEMBL Ensembl Genes 101 ## 2 ENSEMBL_MART_MOUSE Mouse strains 101 ## 3 ENSEMBL_MART_SNP Ensembl Variation 101 ## 4 ENSEMBL_MART_FUNCGEN Ensembl Regulation 101 一步到位代码 选择所需的数据库代码,我需要的是人和家鸡的数据库,直接定义到dataset即可,有时网速很慢,添加了对应地区的host。