关键词

热图,蛋白组学, 生信绘图, 在线分析

热图

什么是热图?

如图,就是一副组学研究中热图的常用绘制模式,每个小方格表示每个基因在不同样本中的定量值,其颜色表示该基因表达量大小,红色为高表达,蓝色为低表达。

1,行名称,一般为样本名称

2,列名称,一般为基因名称

3,图例信息,左侧图例是热图表达量的颜色图例说明,右侧图例为分组信息的图例说明。绘制热图一般会做ZScore归一化处理,可以看到图例数据成0左右对称分布,一般都是做了Zscore归一化的。

4,列聚类,如果不聚类,排序将保持文件数据的默认方式。从样本角度讲,聚类可以观察到你采集的不同组别样本是否被分类到一起了。因为,理论上如果样本来自于同一个组,其特征应该是相似的,而如果在实际操作中,某一个应该属于该组的样本被聚类到别的组了,那就说明这个样本本身的变异度很高,或者说在之前的样本采集或者测序过程中出了什么问题。

5,行聚类,如果不聚类,排序将保持文件数据的默认方式。从基因表达角度讲,聚类可以观察到哪些基因群体具有比较一致的表达变化,因为基因的上下游关系一般是连锁反应的,也就是说一个基因的表达增加可能能够带动一系列的基因的表达增加。

6,列分组信息。

7,行分组信息。

绘图前的数据准备

热图数据

数据来源一般是搜库结果定量表。包含2个维度的数据,一般情况下,每一行是一个基因,每一列是一个样本。

demo数据可以在https://www.r2omics.cn/res/demodata/heatmap/data.heatmap.txt下载。

样本分组数据(可选)

行名的名称和个数要和之前的heatmap数据保持一致,列名为分组名称,可以包含不止一个分组。

demo数据可以在https://www.r2omics.cn/res/demodata/heatmap/sample.class.txt下载。

蛋白分组数据(可选)

行名的名称和个数要和之前的heatmap数据保持一致,列名为分组名称,可以包含不止一个分组。

demo数据可以在https://www.r2omics.cn/res/demodata/heatmap/gene.class.txt下载。

BioLadder生信云平台在线绘制热图

不想写代码?可以用BioLadder生信云平台在线绘制热图。

网址:https://www.bioladder.cn/v2/#/heatMap

上传文件

点击”选择文件”按钮上传自己的文件

demo数据可以在绘图界面直接下载。默认条件下,系统已自动载入demo数据。

可以使用”编辑”选项在线修改您的数据文件。编辑完记得保存哦。

备注:

  1. 点击下载示例,可以下载demo数据;

  2. 在问号提示里,可快速的查看数据的要求格式。

  3. 支持xlsx,xlsx,txt,tsv格式

其中第2个和第3个分组文件是非必须的。

调整参数

根据需求调整参数即可

  • 过滤缺失值超过多少百分比的行:当数据中的缺失值过多时,可能会导致聚类失败,可以过滤掉缺失值过多的行之后,再进行绘制。

  • 是否把0当做NA:是否要把数据中的的0当成NA处理

  • 对数处理:是否对您的数据进行对数处理

  • 归一化:是否对您的数据进行归一化。这里可以选择对数据按行或是按列进行ZScore归一化。

  • 显示行名称:是否显示行名,默认显示。

  • 显示列名称:是否显示列名,默认显示

  • 行聚类:是否对行聚类,默认是(注意,当某一行的数据都为空时会聚类失败)

  • 列聚类:是否对列聚类,默认是

  • 注释图例:是否显示图例,默认显示

  • 聚类时,计算数据间距离的方法: 一般选择默认值就好,当聚类不满意时可以尝试更换算法。euclidean欧氏距离;maximum最大均值差异;manhattan曼哈顿距离;canberra兰氏距离/堪培拉距离;minkowski闵可夫斯基距离;correlation皮尔逊

  • 聚类时判断相似性的方法:一般选择默认值就好,当聚类不满意时可以尝试更换算法。ward:使得合并的类方差最小化;average:组间距离等于两组对象之间的平均距离(计算量比较大);complete:组间距离等于两组对象之间的最大距离(两个不相似的组合数据点可能由于其中的极端值距离较远而无法组合在一起);single:使用两组所有观测值之间的最小距离(易受到极端值的影响。两个不相似的组合数据点可能由于其中的极端数据点而组合在一起)

  • 字体大小

  • 颜色:选择热图颜色(三个颜色):按照由低到高的顺序选择三个颜色,默认为蓝,白,红。

提交查看

上传完数据,并调好参数后,点击右上方”提交”按钮,结果会出现在左侧。如果没有上传自己的数据,会使用默认的demo数据绘图。

有些云工具,默认状态是动态图,动态图指的是,鼠标放上去可获得一些基本的交互信息。可以在提交按钮的右侧,切换为”静态图”,得到出版物级别的图片。

有些云工具,旁边还有个小机器人按钮。 这个是同级、上下级智能切换功能:在使用云工具时,某些工具存在着同级或上下级关系,可以跳转。例如,当你再画箱线的时候,可以一键跳转到小提琴图的模块,免去了数据重复上传的步骤。

下载

在基本参数选项中可以调整图片的高度,宽度以及分辨率,可自由的调整图片的比例和下载格式,所见即所得。

引用

如果您使用了BioLadder生信云完成了数据分析,我们期望您在文章发表时,在方法学部分提及我们。例如,XXXX analysis was performed online in BioLadder (bioladder.cn)

并引用我们的文章,

Yupeng Zhang, Chunyuan Yang, et al. 2024. BioLadder: A bioinformatic platform primarily focused on proteomic data analysis. iMeta 3: e215. https://doi.org/10.1002/imt2.215

更多帮助

使用中遇到的问题,可微信扫描下方二维码,进交流群,咨询。