在用连续型数据布雷斯洛深度作为结局变量时,首先先对数据进行预处理。由于原始基因表达数据维数过高且存在大多数基因与结局变量无关,因此依据京都基因与基因组百科全书在线数据库(Kyoto Encyclopedia of Genes and Genomes,KEGG)中对于皮肤黑色素瘤的通路分析(通路编号“hsa05218”),仅选取通路中涉及到的65个基因纳入模型。该基因表达数据已通过Z-score标准化为零均值同量纲,选取部分基因绘制直方图如图 1中 所示。此外,去掉结局变量缺失的样本,保留358个样本的65个基因表达进入后续分析。