安装R包的3个方法,相信大家都已经非常熟悉了,批量安装R包的技巧在我们周末班准备工作给的安装R包 http://www.bio-info-trainee.com/3727.html ,首先配置中国大陆特色镜像,然后基本上就是按需安装指定的R包:
# https://bioconductor.org/packages/release/bioc/html/GEOquery.html if (!requireNamespace("BiocManager" , quietly = TRUE )) install.packages("BiocManager" ) BiocManager::install("KEGG.db" ,ask = F ,update = F ) BiocManager::install(c("GSEABase" ,"GSVA" ,"clusterProfiler" ),ask = F ,update = F ) BiocManager::install(c("GEOquery" ,"limma" ,"impute" ),ask = F ,update = F ) BiocManager::install(c("org.Hs.eg.db" ,"hgu133plus2.db" ),ask = F ,update = F )
但是有很多包并不是在bioconductor或者 crna,比如在GitHub,本来应该是一句话搞定:
remotes::install_github("genecell/COSGR" )
但是在中国大陆很多地区会遇到如下所示的报错:
中国大陆很多地区的报错 其实其实答案就隐藏在报错里面,复制粘贴 这个 https://api.github.com/repos/genecell/COSGR/tarball/HEAD 到浏览器,即可下载这个压缩包文件:genecell-COSGR-0cc8364.tar.gz
然后就:
install.packages('~/Downloads/genecell-COSGR-0cc8364.tar.gz' ,repos = NULL,type = 'source' )
但是,有一个问题就是这样的没办法自动化安装它的依赖包,不过也很简单了,缺什么就安装什么哈。
成功安装 其实还有一个取巧的办法,我们在:解决monocle中orderCells报错的一波三折 ,提到过,解压你下载好的包的源代码文件夹,然后进入文件夹里面,在里面新建一个Rproj文件,然后打开这个文件,右上方的install and restart按钮,包就会被安装上。
再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理 :
把R的知识点路线图 搞定,如下:
Linux的6个阶段也跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:
第1阶段:把linux系统玩得跟Windows或者MacOS 那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。 第2阶段:做到文本文件的表格化处理 ,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余、查找、切割、替换、合并、补齐,熟练掌握awk、sed、grep 这文本处理的三驾马车。 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘! 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。 第5阶段:任务提交及批处理,脚本编写解放你的双手。 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。 写在文末 我在《生信技能树》,《生信菜鸟团》,《单细胞天地》的大量推文教程里面共享的代码都是复制粘贴即可使用的, 有任何疑问欢迎留言讨论,也可以发邮件给我,详细描述你遇到的困难的前因后果给我,我的邮箱地址是 jmzeng1314@163.com
如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:
We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.
十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。