18 Upest图
18.1 什么是Upset图?
对于集合的可视化,第一时间想到的都是韦恩图(venn diagram),一般集合不超过5个的时候,可视化效果还是不错的。但是一旦数据集增加,比如说五个的时候,你就很难从图中解读出想要的信息了。即便你把它画的很美观,但还是很难直观找到自己需要的信息。可视化的目的不是炫技,而是快速理解数据。而且韦恩图最大只支持7个数据集合。于是这时候就能体会出upset图的优势了。
18.2 绘图前的数据准备
demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/Venn/Venn.rar下载。
第一行为组名,必须要有,会出现在图中。每一列都是一个分组。
18.3 R语言怎么画Upset图
# 加载R包,没有安装请先安装 install.packages("包名")
library(UpSetR) #Upset图(upset 包,适用样本数 2-7)
library(VennDiagram)
# 读取数据文件
<- read.delim('https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/Venn/flower.txt') # 这里读取了网络上的demo数据,将此处换成你自己电脑里的文件
upset_dat <- list(upset_dat[,1], upset_dat[,2], upset_dat[,3], upset_dat[,4], upset_dat[,5], upset_dat[,6], upset_dat[,7]) # 制作Upset图搜所需要的列表文件
upset_list names(upset_list) <- colnames(upset_dat[1:7]) # 把列名赋值给列表的key值
#作图
upset(fromList(upset_list), # fromList一个函数,用于将列表转换为与UpSetR兼容的数据形式。
nsets = 100, # 绘制的最大集合个数
nintersects = 40, #绘制的最大交集个数,NA则全部绘制
order.by = "freq", # 矩阵中的交点是如何排列的。 "freq"根据交集个数排序,"degree"根据
keep.order = F, # 保持设置与使用sets参数输入的顺序一致。默认值是FALSE,它根据集合的大小排序。
mb.ratio = c(0.6,0.4), # 左侧和上方条形图的比例关系
text.scale = 2 # 文字标签的大小
)
# 更多参数 ?upset查看
# 查看交集详情,并导出结果
<- get.venn.partitions(upset_list)
inter for (i in 1:nrow(inter)) inter[i,'values'] <- paste(inter[[i,'..values..']], collapse = '|')
<- subset(inter, select = -..values.. )
inter <- subset(inter, select = -..set.. )
inter write.table(inter, "result.csv", row.names = FALSE, sep = ',', quote = FALSE)
18.4 BioLadder生信云平台在线绘制Upset图
不想写代码?可以用BioLadder生信云平台在线绘制热图。
免费使用,登录后畅享40+模块
网址:
Upset图-BioLadder生物信息在线分析可视化平台www.bioladder.cn/web/#/chart/16