Category: R

  • WGCNA分析流程

    WGCNA是一个R包,对一个完全不会R的人来说,确实费了一番功夫,不过也将我对R的学习提前提上日程。 分析步骤: 1.WGCNA安装 source(“http://bioconductor.org/biocLite.R”) biocLite(c(“AnnotationDbi”, “impute”, “GO.db”, “preprocessCore”)) install.packages(“WGCNA”) 2.输入数据准备 原始数据https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE48213,共56个样本;对数据的合并可参考http://www.biotrainee.com:8080/thread-603-1-1.html,输入文件格式如下:   setwd(‘WGCNA/’) fpkm=read.table(‘test.txt’,sep = ‘\t’,stringsAsFactors = F) head(fpkm) dim(fpkm) ##共56个细胞系,36953个基因的表达矩阵 names(fpkm)##细胞系名称 3.数据预处理 library(reshape2) library(‘WGCNA’) RNAseq_voom <- fpkm WGCNA_matrix = t(RNAseq_voom[order(apply(RNAseq_voom,1,mad), decreasing = T)[1:3000],]) ##top 3000 mad genes,t参数将矩阵变为符合WGCNA要求的形式:行名为gene,列名为样品 datExpr <- WGCNA_matrix save(datExpr, file = “AS-green-FPKM-01-dataInput.RData”) 4.确定最佳beta值   powers = c(c(1:10), seq(from = 12, to=20, by=2))…

  • pheatmap包绘制热图

    目前,绘制热图的软件有很多,我也尝试了几款软件,觉得R的pheatmap包最好用。 pheatmap安装: source(“http://bioconductor.org/biocLite.R”) biocLite(“pheatmap”) pheatmap绘制热图只需三步,导入数据结构如下图: 软件调用: library(pheatmap) 数据导入: data<- read.table(“456.txt”,head = T,row.names=1,sep=”\t”) 绘图: pheatmap(data,cluster_rows=T,cluster_cols=T,scale=”none”,border_color=”white”,color=colorRampPalette(rev(c(“red”,”white”,”blue”)))(102),file=”test.pdf”,width=3,height=5) pheatmap可调的参数有很多,可根据需要自行添加,调整