Skip to content

1.8. 交叉分解(Cross decomposition)

交叉分解模块包含两个主要的算法系列:偏最小二乘法(PLS)(the partial least squares)和典型相关分析(CCA)(the canonical correlation analysis).

这些算法系列可用于查找两个多元数据集之间的线性关系:方法fit的参数XY都是2D数组。

https://scikit-learn.org/stable/_images/sphx_glr_plot_compare_cross_decomposition_0011.png

交叉分解算法可以找到两个矩阵(X和Y)之间的基本关系。它是在这两个空间中,对协方差结构进行建模的潜在变量方法(latent variable approaches)。它尝试将在X空间中找到多维方向,以解释Y空间中的最大多维方差方向。PLS回归尤其适用于,当预测因子的矩阵的变量多于观测值,并且与X之间存在多重共线性(multicollinearity)时的情况。相反,在这些情况下,标准回归算法在这些问题上将会失败。

此模块包含的类有PLSRegressionPLSCanonicalCCAPLSSVD

参考文献:

案例:

©2007-2019,scikit-learn开发人员(BSD许可证)。 显示此页面源码