在统计模型中捕获高多重共线性

可以通过检查检测的高多重共线性 特征值 的 相关矩阵 。极低的特征值表明数据是共线的，相应的 特征向量 表明哪些变量是共线的。

如果数据中不存在共线性，则可以预期所有特征值都不接近零：

>>> xs = np.random.randn(100, 5)      # independent variables
>>> corr = np.corrcoef(xs, rowvar=0)  # correlation matrix
>>> w, v = np.linalg.eig(corr)        # eigen values & eigen vectors
>>> w
array([ 1.256 ,  1.1937,  0.7273,  0.9516,  0.8714])

但是，如果说x[4] - 2 * x[0] - 3 * x[2] = 0，那么

>>> noise = np.random.randn(100)                      # white noise
>>> xs[:,4] = 2 * xs[:,0] + 3 * xs[:,2] + .5 * noise  # collinearity
>>> corr = np.corrcoef(xs, rowvar=0)
>>> w, v = np.linalg.eig(corr)
>>> w
array([ 0.0083,  1.9569,  1.1687,  0.8681,  0.9981])

特征值之一（这里是第一个）接近零。对应的特征向量为：

>>> v[:,0]
array([-0.4077,  0.0059, -0.5886,  0.0018,  0.6981])

基本上忽略了 几乎为零的 系数，上面基本上说x[0]，x[2]并且x[4]是共线性的（如预期的那样）。如果一个标准化xs值并乘以该特征向量，则结果将在零附近徘徊，并且变化很小：

>>> std_xs = (xs - xs.mean(axis=0)) / xs.std(axis=0)  # standardized values
>>> ys = std_xs.dot(v[:,0])
>>> ys.mean(), ys.var()
(0, 0.0083)

注意，ys.var()基本上本征值接近于零。

因此，为了捕获高多线性度，请查看相关矩阵的特征值。

其他 2022/1/1 18:30:17 有480人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

在统计模型中捕获高多重共线性

在统计模型中捕获高多重共线性

其他 2022-01-01 480
Angular.JS：视图共享同一控制器，更改视图时重置模型数据

Angular.JS：视图共享同一控制器，更改视图时重置模型数据

其他 2022-01-01 1046
Django-如何使用South重命名模型字段？

Django-如何使用South重命名模型字段？

Go 2022-01-01 1437
具有内联模型形式或表单集的基于django的类的视图

具有内联模型形式或表单集的基于django的类的视图

Go 2022-01-01 947
获取和传递MVC模型数据到AngularJS控制器

获取和传递MVC模型数据到AngularJS控制器

其他 2022-01-01 756
模型数据和行为放在哪里？[tl; 博士使用服务]

模型数据和行为放在哪里？[tl; 博士使用服务]

其他 2022-01-01 759
Django模型：列的默认值

Django模型：列的默认值

Go 2022-01-01 944
使用Maven的Hibernate元模型生成中的IllegalStateException

使用Maven的Hibernate元模型生成中的IllegalStateException

其他 2022-01-01 878
Django ManyToMany模型验证

Django ManyToMany模型验证

Go 2022-01-01 882
如何创建支持通用ID（包括自动生成的ID）的通用实体模型类？

如何创建支持通用ID（包括自动生成的ID）的通用实体模型类？

其他 2022-01-01 727
JavaScript如何将整个模型追加到formdata并在MVC中获取

JavaScript如何将整个模型追加到formdata并在MVC中获取

javascript 2022-01-01 622
使用Django / South重命名模型的最简单方法？

使用Django / South重命名模型的最简单方法？

Go 2022-01-01 922
如何在不同的DB中使用带有外键的Django模型？

如何在不同的DB中使用带有外键的Django模型？

Go 2022-01-01 769
Spring文件上传未绑定到模型属性对象

Spring文件上传未绑定到模型属性对象

Java 2022-01-01 531
Node.js + Express.js用户权限安全模型

Node.js + Express.js用户权限安全模型

Node 2022-01-01 636
如何在Struts2网格中显示模型类的嵌套属性？

如何在Struts2网格中显示模型类的嵌套属性？

其他 2022-01-01 558
如何将三角形的绕组校正为3D Mesh模型的逆时针方向？

如何将三角形的绕组校正为3D Mesh模型的逆时针方向？

其他 2022-01-01 650
了解MVC：模型上的“胖”概念，控制器上的“瘦”概念是什么？

了解MVC：模型上的“胖”概念，控制器上的“瘦”概念是什么？

其他 2022-01-01 785
ng模型和data-ng模型之间的区别

ng模型和data-ng模型之间的区别

其他 2022-01-01 553
使用模型表单创建自定义错误消息

使用模型表单创建自定义错误消息

其他 2022-01-01 631
无法创建实体数据模型-使用MySql和EF6

无法创建实体数据模型-使用MySql和EF6

MySQL 2022-01-01 511

在统计模型中捕获高多重共线性

撰写回答

推荐问题

在统计模型中捕获高多重共线性

Angular.JS：视图共享同一控制器，更改视图时重置模型数据

Django-如何使用South重命名模型字段？

具有内联模型形式或表单集的基于django的类的视图

获取和传递MVC模型数据到AngularJS控制器

模型数据和行为放在哪里？[tl; 博士使用服务]

Django模型：列的默认值

使用Maven的Hibernate元模型生成中的IllegalStateException

Django ManyToMany模型验证

如何创建支持通用ID（包括自动生成的ID）的通用实体模型类？

JavaScript如何将整个模型追加到formdata并在MVC中获取

使用Django / South重命名模型的最简单方法？

如何在不同的DB中使用带有外键的Django模型？

Spring文件上传未绑定到模型属性对象

Node.js + Express.js用户权限安全模型

如何在Struts2网格中显示模型类的嵌套属性？

如何将三角形的绕组校正为3D Mesh模型的逆时针方向？

了解MVC：模型上的“胖”概念，控制器上的“瘦”概念是什么？

ng模型和data-ng模型之间的区别

使用模型表单创建自定义错误消息

无法创建实体数据模型-使用MySql和EF6

分类汇总

您的鼓励是对我最大的支持