RNA-seq

阿里云服务新配置代码备存
新添了阿里云服务器,超级推荐云翼计划,学生能享受的优惠真的很赞,可惜我没有机会了,只有等双11的活动了,点击链接进去即可选购~~ 主要是为了解决frp走国外服务器的延迟问题,同时为实验室数据分享网址的建立练手,当然以后肯定还会有很多购新的事件,因此这里记录下相关代码和备注事项,方便以后的操作: SSH登陆 垃圾阿里云,操作复杂,事项繁多,比Vutlr的界面复杂太多了,不过安全性上面确实可能要高一些,新手直接劝退吧,不过新手也不会上来就买CES,或者买来就是练手的,我就是新手,差点被劝退了~~~ 首先重置密码,即设置新密码,为什么不能随机给个默认的,要这么麻烦,吐槽+1…… 然后在安全组界面添加密钥,默认只能通过密钥登陆,安全性提高,然后记得重启CES,随便啥远程登陆进去~再次前排推荐Visual Studio Code!!! 虚拟内存 由于开启swap分区会导致硬盘IO性能下降,因此阿里云服务器初始状态未配置swap,如果某些应用需要开启swap分区,自己设置即可。小鸡的烦恼,土豪随意 sudo dd if=/dev/zero of=swapfile bs=1024 count=2048000 sudo mkswap -f swapfile chmod 0600 swapfile sudo swapon swapfile sudo cp /etc/fstab /etc/fstab.bak echo '/swapfile none swap sw 0 0' | sudo tee -a /etc/fstab #学到么?下面还有类似操作喔~ shutdown -r now #重启看下free R, Shiny and Rstudio R install sudo apt-key adv --keyserver keyserver.
Gene ID转换
为什么要在R中进行ID转换 在转录组数据或者其他分析中,好吧,其实是因为我做的物种是家鸡,根本就没有人和鼠那样有着非常完善和时刻更新的数据库做为支持,我经常会遇见GeneID转换,同源基因转换的问题,之前一直利用Ensembl主页里面的biomart进行数据下载,然后在excel里面利用vlookup进行操作,哎,费时费力,而且不能高度自动化和重复化~~(传统湿实验室人员的基本操作思维)~~,现在已经开始将大部分操作都在R里面进行了,刚好学习了biomaRt包可以完美替代之前的操作流程,下面就是相关笔记及备注: 好吧,这是第一篇Rmd笔记,Rmarkdown真的超级好用啊! 安装所需的软件包 下面的R包也包括Y叔的clusterProfiler了,里面也有ID转换的板块,也是非常实用的,一并汇总了。 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("biomaRt") biomaRt示例 首先还是推荐看官方文档,没有什么攻略比官方文档更靠谱了,除非懒~ library("biomaRt") library(org.Gg.eg.db) library(org.Hs.eg.db) library(clusterProfiler) library(DOSE) # 查看Marts库 listMarts(host="asia.ensembl.org") ## biomart version ## 1 ENSEMBL_MART_ENSEMBL Ensembl Genes 101 ## 2 ENSEMBL_MART_MOUSE Mouse strains 101 ## 3 ENSEMBL_MART_SNP Ensembl Variation 101 ## 4 ENSEMBL_MART_FUNCGEN Ensembl Regulation 101 一步到位代码 选择所需的数据库代码,我需要的是人和家鸡的数据库,直接定义到dataset即可,有时网速很慢,添加了对应地区的host。