28 桑基图(可交互)
28.1 什么是桑基图?
桑基图(Sankey Diagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小。
桑基图主要由边、流量和节点组成,其中边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例地显示,边越宽,数值越大。
本文我们就来讨论一下桑基图是如何绘制的。
28.2 绘图前的数据准备
demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/sankeyNetwork/sankeyNetwork.zip下载。
28.2.1 边(连线)数据
包含4列,前两列定义连线,从哪个节点到哪个节点,可以有多个层面。第三列是数值,定义连线粗细,第四列是颜色,定义连线的颜色。
28.2.2 节点数据
包含2列,第一列是边数据文件中的节点,第二列是该节点所在层次的颜色。
如果没有该数据,则会默认只有一个颜色。
28.3 R语言怎么画桑基图
library(networkD3)
library(tidyverse)
# 读取连线文件和节点文件
= read.delim("https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/sankeyNetwork/link.csv",sep = ",")
MisLinks = read.delim("https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/sankeyNetwork/node.csv",sep = ",")
MisNodes
# 处理数据
# 因为networkD3需要的连线数据,是节点文件里的名称的索引。所以,需要做一个名称到索引的转化
= list()
Node2index $name] = 0:length(MisNodes$name)
Node2index[MisNodes= MisLinks %>%
MisLinks mutate(source2 = unlist(Node2index[source])) %>%
mutate(target2 = unlist(Node2index[target]))
# 定义颜色
= paste(c(unique(MisNodes$group_color),unique(MisLinks$group_color2)),collapse = '","')
color2project <- paste0('d3.scaleOrdinal().domain(["',color2project,'"]).range(["',color2project,'"])')
my_color
# 绘图
sankeyNetwork(Links = MisLinks,
Nodes = MisNodes,
Source = "source2",
Target = "target2",
Value ="value",
NodeID = "name",
NodeGroup = "group_color",
LinkGroup = "group_color2",
colourScale = JS(my_color),
fontSize = 10
)
28.4 BioLadder生信云平台在线绘制桑基图
不想写代码?可以用BioLadder生信云平台在线绘制桑基图。