当前位置: 首页 > java >正文

协方差矩阵与相关系数矩阵

文章目录

    • 前言
    • 1. 方差、协方差与相关系数
    • 2. 协方差矩阵
    • 3. 相关系数矩阵

前言

  本篇博客主要介绍一下方差、协方差及相关系数的相关知识,进而引入了协方差矩阵与相关系数矩阵,并结合相关实例进行说明。

1. 方差、协方差与相关系数

  在《概率论与数理统计》中,方差用来度量单个随机变量 X X X的离散程度,记为 D X DX DX,计算公式如下:
D X = E ( X − E X ) 2 = E X 2 − E 2 X \begin{aligned} DX &= E(X-EX)^2 \\[3pt] &= EX^2 - E^2X \end{aligned} DX=E(XEX)2=EX2E2X  数学表达式为: σ 2 ( x ) = 1 n − 1 ∑ i = 1 N ( x i − x ˉ ) 2 \sigma ^2(x) = \frac {1} {n-1}\sum _{i=1} ^N (x_i - \bar x)^2 σ2(x)=n11i=1N(xixˉ)2

  即方差 = 平方的期望 - 期望的平方

  协方差用来度量两个随机变量 X X X Y Y Y间的相似程度,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y),计算公式为:
C o v ( X , Y ) = E [ ( X − E X ) ⋅ ( Y − E Y ) ] = E ( X Y ) − E X ⋅ E Y \begin{aligned} Cov(X,Y) &= E[(X - EX) \cdot (Y - EY)] \\[3pt] &= E(XY) - EX \cdot EY \end{aligned} Cov(X,Y)=E[(XEX)(YEY)]=E(XY)EXEY  数学表达式为: σ ( x , y ) = 1 n − 1 ∑ i = 1 N ( x i − x ˉ ) ( y i − y ˉ ) \sigma (x, y) = \frac {1} {n-1}\sum _{i=1} ^N (x_i - \bar x) (y_i - \bar y) σ(x,y)=n11i=1N(xixˉ)(yiyˉ)

  从公式上来看,协方差是两个变量与自身期望做差再相乘,然后对乘积取期望。也就是说,当其中一个变量的取值大于自身期望,另一个变量的取值也大于自身期望时,即两个变量的变化趋势相同,此时,两个变量之间的协方差取正值。反之,即其中一个变量大于自身期望时,另外一个变量小于自身期望,那么这两个变量之间的协方差取负值。

  相关系数,也叫皮尔逊(Pearson)相关系数,用来度量两个随机变量 X X X Y Y Y间的相关程度,记为 ρ X Y \rho_{XY} ρXY,计算公式为:
ρ X Y = C o v ( X , Y ) D X D Y \rho_{XY} = \frac {Cov(X,Y)} {\sqrt {DX} \sqrt {DY}} ρXY=DX DY Cov(X,Y)  若 ρ X Y > 0 \rho_{XY} > 0 ρXY>0,表示随机变量 X X X Y Y Y呈正相关;
  若 ρ X Y < 0 \rho_{XY} < 0 ρXY<0,表示随机变量 X X X Y Y Y呈负相关;
  若 ρ X Y = 0 \rho_{XY} = 0 ρXY=0,表示随机变量 X X X Y Y Y不相关,即相互独立;
  若 ρ X Y = ± 1 \rho_{XY} = \pm1 ρXY=±1,表示随机变量 X X X Y Y Y呈线性相关;

  相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差,它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度。

2. 协方差矩阵

  在实际场景中,我们在描述一个物体时,并不会单单从一个或两个维度去描述,比如说,在描述一个神经网络模型的性能时,需要从模型的大小,精度,推理时间等多个维度来衡量。在进行多维数据分析时,不同维度之间的相关程度就需要协方差矩阵(covariance matrix)来描述,维度之间的两两相关程度就构成了协方差矩阵,而协方差矩阵主对角线上的元素即为每个维度上的数据方差。
  协方差矩阵的表达式为: ∑ = [ σ ( x 1 , x 1 ) … σ ( x 1 , x n ) ⋮ ⋱ ⋮ σ ( x n , x 1 ) … σ ( x n , x n ) ] \sum = \begin{bmatrix} \sigma (x_1, x_1) & \dots & \sigma (x_1, x_n) \\ \vdots & \ddots & \vdots \\ \sigma (x_n, x_1) & \dots & \sigma (x_n, x_n) \\ \end{bmatrix} = σ(x1,x1)σ(xn,x1)σ(x1,xn)σ(xn,xn)

3. 相关系数矩阵

  顾名思义,就是由相关系数组成的矩阵(correlation matrix),也叫系数矩阵,矩阵中的每个元素的取值范围为[-1, 1]
  相关系数矩阵的表达式为: C = [ ρ ( x 1 , x 1 ) … ρ ( x 1 , x n ) ⋮ ⋱ ⋮ ρ ( x n , x 1 ) … ρ ( x n , x n ) ] = [ 1 … ρ ( x 1 , x n ) ⋮ ⋱ ⋮ ρ ( x n , x 1 ) … 1 ] \begin{aligned} C &= \begin{bmatrix} \rho(x_1, x_1) & \dots & \rho(x_1, x_n) \\ \vdots & \ddots & \vdots \\ \rho(x_n, x_1) & \dots & \rho(x_n, x_n) \\ \end{bmatrix}\\[5pt] &= \begin{bmatrix} 1 & \dots & \rho(x_1, x_n) \\ \vdots & \ddots & \vdots \\ \rho(x_n, x_1) & \dots & 1 \\ \end{bmatrix} \end{aligned} C= ρ(x1,x1)ρ(xn,x1)ρ(x1,xn)ρ(xn,xn) = 1ρ(xn,x1)ρ(x1,xn)1

http://www.xdnf.cn/news/11228.html

相关文章:

  • 联想y430完全拆机图解_y430p拆机详细步骤及如何安装mSATA接口的固态硬盘?
  • 磁盘碎片原理分析
  • 同一网络(局域网)下远程控制另一台电脑
  • [免费源码]个人引导页毛玻璃页面html源码
  • java操作JSON
  • 蠕虫病毒代码(纯属参考,请勿用于非法事件)
  • 游戏发展演变:何谓第三代网游?
  • 蜀门linux服务端架设,蜀门私服常用修改配置大全
  • 【干货】零基础30分钟让你拥有一个完整属于自己的短视频APP系统
  • 文心一言APP国区可下载!免费体验120+玩法,PPT大纲Excel公式一键生成
  • 各国搜索引擎大全
  • 使用Python截取nc文件数据保存到CSV文件
  • 忘记Gmail谷歌账号密码或者密码错误怎么办?用这种方法轻松搞定
  • 2024年Go最全PHP从基础到高级详细教程(完整版)_php高级教程(1),重要概念一网打尽
  • Linux学习记录--内核|内核模块编译
  • VMware 8安装Mac OS X 10.7 Lion
  • css3帮助文档,CSS3 最新版参考手册
  • rk3288 使用i2ctools调试pca9685
  • 基于Attention的机器翻译模型,论文笔记
  • 嵌入式开发概述
  • 【转】Skyline软件介绍
  • 【miscellaneous】IP多播技术及其编程
  • 硬件项目开发 datasheet篇
  • 一些常用软件的网络端口协议分类介绍
  • mysql5.0免安装版_MySql5.0免安装版配置
  • 万维网(www)
  • free技术详解 lock_简化概念下的 lock-free 编程
  • MSN、QQ、阿里旺旺在线客服源代码
  • Android 开发环境搭建(详细)
  • windows注册表启动项