Academic | Jiannan Zhang

单细胞文章后记

今天在写一篇审稿意见的最终回复，突然想起去看下之前别人给我的最终意见，打开了最近发表的scRNA文章的意见，突然发现Reviewer 3的最终意见之前竟然被我忽略了，提交后就等着接收消息，完全没有再去看专家的回复意见@@ 不看不知道，看了之后突然又有了那种被击中内心的体验： “Well done. I am sure this paper will be an important reference both for avian as well as for comparative studies of the vertebrate pituitary gland. I would be glad to read a follow up study that fills up the missing data on the GH cells.

Last updated on Jan 3, 2022 1 min read R, Linux

单细胞数据公开啦

家鸡垂体单细胞的文章几个月前就接收发表了，经历了差不多一年的时间吧，一共有4个审稿人，不过中途两位退出，最终在一位超级友善而严格的审稿人的帮助下，在实验室处于困境下总算得以见刊，也算了却了一桩大事，从湿实验到干实验，算是一次转行，码了上千行的代码，不算是白费~精简代码是以后要改进的主要地方了。论文撰写的时候就一直想把数据以一种交互式网页的方式展示，shiny app超级合适我这种新手，毕竟我是不会做网页UI的生物研究人员= =！但是又没有时间去构建好看和好用的界面，最终放弃在正文里面添加链接呈现数据，非常遗憾，不过这个交互式网页一直在实验室内部共享的，文章见刊了，也就可以正式的online公开了，拖了很近，假期结束前还是把网页界面稍微调整了下，删除了密码验证，打开就可以直观的展示这篇单细胞文章的数据，当然，仅仅是最基础的通过基因名查看基因分布，对于不会码代码的同学来说，还是很省事的，毕竟单基因分布的图片直接导出就可以达到发表要求了… 网站链接如下：http://scrna.avianscu.com/pit/，https的链接始终有问题，所以最好就是http打开了，nginx反代始终达不到预期效果，穿透frp实现https对现在的我来说还是很难的= =！没图没真相，放一张预览图哈：

Last updated on Jan 3, 2022 1 min read R, Linux

单细胞原始数据上传

单细胞的文章还在返修ing，但是杂志已经连续发邮件催促提交原始数据的索引号，之前计划上传到GEO和NCBI的SRA数据库中，但是突然一想，国内应该已经有类似的生物信息数据中心了吧，一番搜索，发现国家生物信息中心的存在，而且确实可以上传数据并用于文章发表，但是第一次使用，肯定要踩坑，所以呢，记录一下完整的数据上传过程，以后也会经常用到的@@ 原始数据整理 National Genomics Data Center (NGDC)支持中文，所以很多地方对于本土用户还是非常方便的，不过对国外的研究人员，可能就不是那么友好了…或许以后这样的情况会越来越多呢… 我是单细胞的数据，就只上传原始Raw Data数据就好了，计算好的表达矩阵就不提交了（其实是没有办法在这里提交，GEO倒是很方便的），数据按照数据中心要求打包为fastq.gz格式，修改好名字，提前记录好MD5值。 md5sum <path to file> #linux里面很简单很迅速就可以得到文件的MD5值了 CertUtil -hashfile <path to file> MD5 #Windows里面可以在powershell里面简单查询，速度较慢新建BioProject 按照网站要求，首先建立新的BioProject，按照要求填写即可，so easy。新建GSA编号按照要求，需要准备2个excel表格，录入数据相关信息，按照说明来即可。踩坑记录： 1、GSA_Template.cn.xlsx里面有BioSample name的选项，之前以为是S1,S2这种按顺序即可，结果是输入之前BioProject里面录入的样品名称，导致耽误了一天，一直以为需要等待之前录入的BioSample编号被系统承认@@！！后面发现不对劲，修改为样品名称而不是样品编号，顺利通过…

Last updated on Jan 3, 2022 1 min read R, Linux

腾讯云服务器及高带宽的nextcloud来啦

一年一度的双十一又来了，不一样的2020，但我还是没有什么要买的，除了云服务器，每年的双十一都是最优惠的时候，疫情期间初次替RQ付款购买了阿里云的服务器，结果我和老婆的都不能再购新，居然被认作老用户，试了很多方法都不行，果断被劝退，三年2核4G3M的服务器，原价我是怎么也买不起的了，阿里不给我机会，那我自然去腾讯，竞争对客户的最大好处就是，你不希望被我撸羊毛，那我就去其他家，数据积累到三年后，腾讯云价格再贵，我也会续费，阿里云错过了就是错过了，以后也不会给实验室的人推荐阿里云，谁让曾经被伤过心呢…不知道在个人blog里面吐槽这些好不好，管他呢，反正又没人看的@@ 下面是简单的记录下云平台的尝鲜记录和高带宽的nextcloud安装记录腾讯云腾讯云居然不是默认密钥登陆ssh的，所以在控制面板那里人为添加密钥，同时将我常用的端口开放，这些都是基本操作，哦，我一气之下买的是2核4G5M三年的服务器，￥1348，3M的是700左右，带宽啊带宽，国内就是这么贵！然后就没有什么坑了，毕竟云服务器现在已经很成熟了…不会就google~ Nextcloud 不得不说，5M带宽的唯一目的就是这个私人云盘了，够快~而且50G的空间也足够实验室使用了~~ 软件虽然方便，但是各种配置还是很麻烦的，所以呢，Docker来啦~懒人的选择= =！安装Docker apt install docker.io 安装Nextclouddocker docker pull nextcloud 从官网下载肯定很忙，云平台都有镜像下载，安装Docker后设置镜像源下载 vim /etc/default/docker DOCKER_OPTS="--registry-mirror=https://mirror.ccs.tencentyun.com" sudo service docker restart 在服务器对应端口（这里是1314）新建nextcloud服务 docker run --name nextcloud -p 1314:80 -v ~/nextcloud/data/:/var/www/html/data -v ~/nextcloud/apps/:/var/www/html/apps -d nextcloud

Last updated on Jan 3, 2022 1 min read R, Linux

新电脑设置git-ssh

换了家里的电脑登陆git始终遇到ssh登陆错误，使用密钥登陆不能正常通过，又不想申请新的密钥（虽然最后是这么办的，之前的密钥需要密码确认，嫌麻烦，这次就取消密码了），花了不少时间，走了冤枉路，所以每次的坑都会记录下来，我才是不是那个经常踩坑的人呢~~ 提出问题：如何在新电脑添加已存在的密钥并且让git使用它正常连接到github 1.添加已有的id_sra到ssh-agent 使用github给开源项目添加ssh后需要在本地将私钥添加到ssh-agent，通常网上给出的方法是在git bash界面中输入： ssh-add 私匙文件路径然而，在windows下通常会报错： Could not open a connection to your authentication agent 解决方法：打开git Bash命令行,依次执行 1.exec ssh-agent bash 2.eval ssh-agent -s 3.ssh-add "XXX\.ssh\id_rsa_github" **引号中的路径就是你私钥文件的路径但是，在Windows下，ssh-agent 进程将继续运行，直到您注销、关闭计算机或终止该进程。重启Windows后，如果按照第一步中的方法进行设置，可能每次打开Git Bash，需要手动添加私钥到ssh-agent。所以为了使我们每一次打开Git Bash时自动启动ssh-agent，进行如下设置：

Last updated on Jan 3, 2022 1 min read R, Linux

新电脑利用scoop安装git

等着吃午饭是最幸福的(丈母娘来了)，不干活了就打开折腾下新安装的3700X电脑，装了两个月，都没有时间用，VScode倒是早就装好了，可以当个记事本用（就是这么全能），blog在OneDrive里面，直接打开文件夹就同步，尴尬的发现没有git，刚好上次更新blog的时候发现了scoop在windows里面炒鸡好用，所以感觉可以再操作熟悉一遍，流水账来啦： Scoop安装–强大的Windows命令行包管理工具打开 PowerShell，建议管理员权限打开设置用户安装路径 $env:SCOOP='D:\Scoop' [Environment]::SetEnvironmentVariable('SCOOP', $env:SCOOP, 'User') 设置允许 PowerShell 执行本地脚本 Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser 安装scoop iwr -useb get.scoop.sh | iex #大概率会遇到失败 #修改hosts吧，少年~ C:\Windows\System32\drivers\etc #添加到最后 199.

Last updated on Jan 3, 2022 1 min read R, Linux

Pagedown制作CV及展示在个人主页

这段时间做的工作慢慢地变成了一篇篇的文章，项目也在努力的申请和完成，即使学院主页上仍然没有我的名字，不过呢，我的个人主页则是早早的就建好了，但是一直缺少一份正式的CV，说不定哪天就会用到呢@@ 鉴于最近超级迷恋R系列的XXXXdown，Pagedown又推荐用于制作CV，空暇之余变启动了个人CV之旅，也简单记录下整个过程。安装Pagedown remotes::install_github('rstudio/pagedown') pagedown::html_resume 抄… 呃，从GitHub抄…（读书人的事情怎么能叫抄，借鉴借鉴）借鉴于数据从csv导入的思路，参考 https://github.com/nstrayer/cv 和 https://github.com/GuangchuangYu/cv 的格式进行微调（下载文件改啊改），自己做的最大的改进在于第二页起就没有右边的侧边栏了，使得整体简洁大方了不少，虽然少了Y叔那里酷炫的google schoolar引用数据，等哪天和他一样牛的时候我再加上，哈哈，鬼知道有么有那天呢…哦，去掉侧边栏参考了 https://community.rstudio.com/t/pagedown-html-resume-with-aside-on-first-page-only/46351 里面的建议，css里面加一段代码就ok了： .pagedjs_page:not(:first-of-type) { --sidebar-width: 0rem; --sidebar-background-color: #ffffff; --main-width: calc(var(--content-width) - var(--sidebar-width)); --decorator-horizontal-margin: 0.2in; } 然后呢，先跑一下代码，整齐的CV就出来了，接着就是修改原始录入数据和调整相关信息，字体格式行距位置都是高端玩家的东西，我就不需要再去折腾了（菜就是原罪）…还不如写一写跳坑的东东…

Last updated on Jan 3, 2022 1 min read R, Linux

阿里云服务新配置代码备存

Last updated on Jan 3, 2022 3 min read R, Linux

Gene ID转换

为什么要在R中进行ID转换在转录组数据或者其他分析中，好吧，其实是因为我做的物种是家鸡，根本就没有人和鼠那样有着非常完善和时刻更新的数据库做为支持，我经常会遇见GeneID转换，同源基因转换的问题，之前一直利用Ensembl主页里面的biomart进行数据下载，然后在excel里面利用vlookup进行操作，哎，费时费力，而且不能高度自动化和重复化~~（传统湿实验室人员的基本操作思维）~~，现在已经开始将大部分操作都在R里面进行了，刚好学习了biomaRt包可以完美替代之前的操作流程，下面就是相关笔记及备注：好吧，这是第一篇Rmd笔记，Rmarkdown真的超级好用啊！安装所需的软件包下面的R包也包括Y叔的clusterProfiler了，里面也有ID转换的板块，也是非常实用的，一并汇总了。 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("biomaRt") biomaRt示例首先还是推荐看官方文档，没有什么攻略比官方文档更靠谱了，除非懒~ library("biomaRt") library(org.Gg.eg.db) library(org.Hs.eg.db) library(clusterProfiler) library(DOSE) # 查看Marts库 listMarts(host="asia.ensembl.org") ## biomart version ## 1 ENSEMBL_MART_ENSEMBL Ensembl Genes 101 ## 2 ENSEMBL_MART_MOUSE Mouse strains 101 ## 3 ENSEMBL_MART_SNP Ensembl Variation 101 ## 4 ENSEMBL_MART_FUNCGEN Ensembl Regulation 101 一步到位代码选择所需的数据库代码，我需要的是人和家鸡的数据库，直接定义到dataset即可，有时网速很慢，添加了对应地区的host。

Last updated on Mar 13, 2020 6 min read R

Shiny Server

单细胞数据展示最近一段时间，实验室测了不少单细胞数据，为了方便实验室成员预览数据和调用数据，之前利用Shiny在服务器后台运行Rscript XX.R进行数据在线展示，但是现在一下子增加很多数据，就开始考虑部署服务器版的Shiny Server了。未发表数据肯定不能托管，而且数据量也较大，VPS那点能力也hold不了，最后决定在自己服务器上面部署。需求：单细胞数据实验室内部展示下载安装Shiny Server 官网安装服务器版本，参考官网步骤即可，提前安装好R和shiny等包。 sudo apt-get install gdebi-core wget https://download3.rstudio.org/ubuntu-14.04/x86_64/shiny-server-1.5.13.944-amd64.deb sudo gdebi shiny-server-1.5.13.944-amd64.deb 软件参数调试 #打开配置文件，直接在VScode中打开编辑即可。大赞VScode！！！！！！VScode YES！！！！！ /etc/shiny-server/shiny-server.conf # Instruct Shiny Server to run applications as the user "shiny" # 我改成了自己的账户，不需要新建立一个"shiny"用户 run_as 自己的用户名; access_log /var/log/shiny-server/access.

Last updated on Jan 3, 2022 2 min read R