对高分辨率质谱检测得到的数据进行生物统计学分析,并生物信息学分析,挖掘有价值信息,已经成为组学检测分析的标准化流程。

除了常规的差异表达基因GO注释及富集分析,KEGG通路注释及富集分析,蛋白互作网络分析常规分析外,我们还可以根据客户需求,定制个性化分析。
1) 样本间相关性分析:对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。计算样本之间的相关系数,并用热图等表示相关系数的大小。
2)主成分分析:
主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。每个样本有n 个基因,通过线性变换,将原始数据中重要的信息按照优先级提取出来,即主成分。这样截取前几个主成分就可以将样品映射到可视化的平面中。
3)聚类分析:
所谓聚类,就是将相似的事物聚集在一 起,而将不相似的事物划分到不同的类别的过程,是数据分析之中十分重要的一种手段。常用的聚类分析方法有:层次式聚类分析法(通过采用的是average‐linkage 方法),K-means 聚类分析法。
层次聚类,是一种很直观的算法。顾名思义就是要一层一层地进行聚类,可以从下而上地把小的cluster合并聚集,也可以从上而下地将大的cluster进行分割。最常用的,就是average-linkage,即计算两个cluster各自数据点的两两距离的平均值。 K-means是另一种常用的聚类方法之一,前提是需要用户事先给出聚类数目k。两种聚类法常常用于对蛋白质表达数据集进行层次的分析,并采用直观图的表示聚数的结果。
4)差异蛋白筛选:
通过我们采用 T Test 计算到的p‐Value 和Fold change 筛选差异蛋白,用火山图可以直观的显示显著上下调蛋白。
5) 维恩图采用固定位置的交叉环形式用封闭曲线(内部区域)表示集合及其关系的图形。可用来描述蛋白质数据集之间的交叠情况。