基因剃须是一种将行为相似的基因群聚类的方法,这些基因的表达变化与观察到的生物学变化联系最紧密。其基本方法类似于观测到的主成分(奇异值分解、最大特征值等),采用顺序扭转的方法:根据特征向量识别一个典型的“基因向量”,并根据与该向量的一致性对基因进行排序。然后剔除最坏拟合,确定并拟合一个新的正则向量。
的GeneClust分布是基因剃须方法的新实现。Geneclust JS是一个Javascript实现的GeneClust包,可以在你的浏览器中运行,所以不需要安装任何软件。
不过,您必须使用相对现代的浏览器。最新版本的Chrome和火狐浏览器都可以工作。当Geneclust JS页面被加载时,它会检查你的浏览器是否有必要的功能。如果它显示警告警告,请升级到更现代的浏览器。
要使用Geneclust JS,必须有一个包含要分析的数组数据的输入数据文件,以及一个监督文件,将每个样本分配给一个样本类。
数组数据必须存储在一个标签分离(tsv)文件中,输入行对应变量(例如基因),列对应数据点(例如样本)。第一行必须是包含后续数据行中每一列名称的标题。随后的每一行对应于输入数据矩阵的一行。每个数据行的第一列必须包含该行的名称。第一行(标题)可能比数据行少一列(例如通常由R产生),也可能包含相同数量的列(在这种情况下,标题行的第一列被忽略)。输入数据文件示例:阿龙2000,阿龙446,阿龙最高,NCI 60.
如果提供监督数据,则数组数据文件中的每个数据列必须精确地包含一行,并且每一行必须精确地包含一个类名。类按照它们各自的顺序与数据列匹配。分类数据文件示例:阿龙分类,NCI 60分类.
用户界面由四个输入部分和一个结果部分(最初为空)组成。您应该按顺序完成输入部分。
选择输入数据文件后,浏览器将加载该文件,执行一些基本的数据检查,并在文件选择器下面总结结果。如下所示的绿色汇总线表明数据已成功加载。
在加载分类数据之后(如果有的话),浏览器还将显示分类文件中找到的数据类。
如果需要,可以使用第三个输入部分中的字段修改所需的Gene Shaving参数。如果没有加载监督文件,或者监督百分比为0时,将执行无监督的剃须操作。如果监督百分比是100时,将执行完全监督,否则将执行部分监督。
第四部分:
应用程序将开始在结果表下面显示跟踪信息,以使您了解进度,并替换重置按钮和一个取消按钮。当集群生成时,它们将被添加到Results表中。请注意,当Geneshaving正在进行时,应用程序是响应用户输入的。当生成预先指定数量的集群时,或者无法提取任何额外的集群时,Geneshaving将自动终止。你可以通过按下,提前终止基因生成过程取消按钮。如果需要生成其他集群,请按运行Geneclust按钮一次。
使用完此数据集后,按重置按钮清除已加载的数据。注意,对Geneshaving参数的更改不会重置。
至少一个集群生成后,到目前为止产生的基因结果就可以显示或打印出来。注意,可以在生成后续集群时生成这些可选的显示。取消后续的集群生成不会影响已经生成的集群或后续重新启动集群生成的能力。
要显示特定集群的集群映像,请单击Results表中对应的集群编号(最左边的列)。要显示该群集的诊断图,请单击诊断表的列。(目前,只有差距的阴谋是可用的)。
选中的群集图像或诊断图将显示在弹出对话框中。可以同时显示多个图像或图形。您可以微调显示(颜色方案,字体大小,像素大小等)按显示选项按钮就在结果表上面。(注意,更改显示参数将关闭当前打开的任何对话框窗口。)
群集图像或诊断图可以在单独的窗口或选项卡中通过按独立的形象按钮。图像或绘图可以从这个新窗口/选项卡打印或保存。也可以通过右键单击来保存图像独立的形象按钮,然后选择链接另存为…(或等价)从弹出菜单。保存的图像的数据格式将是可缩放的矢量图形(SVG)。SVG格式图形文件的编辑器(例如Inkscape)可用于生成其他所需格式的图像。
类似地,集群的数据也可以使用集群的数据按钮。