1.8. 交叉分解(Cross decomposition)
交叉分解模块包含两个主要的算法系列:偏最小二乘法(PLS)(the partial least squares)和典型相关分析(CCA)(the canonical correlation analysis).
这些算法系列可用于查找两个多元数据集之间的线性关系:方法fit
的参数X
和Y
都是2D数组。
交叉分解算法可以找到两个矩阵(X和Y)之间的基本关系。它是在这两个空间中,对协方差结构进行建模的潜在变量方法(latent variable approaches)。它尝试将在X空间中找到多维方向,以解释Y空间中的最大多维方差方向。PLS回归尤其适用于,当预测因子的矩阵的变量多于观测值,并且与X之间存在多重共线性(multicollinearity)时的情况。相反,在这些情况下,标准回归算法在这些问题上将会失败。
此模块包含的类有PLSRegression
,PLSCanonical
,CCA
和PLSSVD
。
参考文献:
案例:
©2007-2019,scikit-learn开发人员(BSD许可证)。 显示此页面源码