Appearance
16.3.4 相关和回归
相关分析根据试验数据确定总体两个或两个以上变量之间是否存在某种相关关系, 回归分析用于确定变量间相关关系的形式.
16.3.4.1 两个可测变量的线性相关
1. 二维随机变量
下述公式通常适用于连续随机变量, 但对离散变量, 很容易用相应公式进行替换. 设
随机变量
成立. 由其联合密度函数
(1) 期望
(2) 方差
(3) 协方差
(4) 相关系数
假定上述任一期望值都存在. 协方差也可由下述公式计算
相关系数是对
若
(16.153)
的二维正态分布时,则由
2. 两个变量的独立性检验
在实践中经常遇到问题: 当
(1) 提出假设
(2) 确定显著性水平
(3) 计算经验相关系数
且
(4) 若
16.3.4.2 两个可测变量的线性回归
1. 确定回归直线
如果说通过相关系数可探寻变量
在最简单的线性回归情形下,假设对于任意定值
方差为
成立, 从而可得估计值
且.
(16.154b) 给出了经验相关系数
2. 回归系数的置信区间
当确定了回归系数
和
这是服从自由度为
回归直线
16.3.4.3 多元回归
1. 函数关系
设变量
描述. 函数
| 函数
2. 向量形式的记法
在多元情形, 以向量
的形式记公式很方便. 此时, (16.160) 可记为
3. 正则方程组及求解
由于随机测量存在误差, 理论关系式 (16.160) 不能由测量值
确定. 以
的形式求其解,系数
确定. 引入记号
(16.163d)
由 (16.163c) 可得到所谓正则方程组
用来确定
5 | 3 | 5 | 3 | |
0.5 | 0.5 | 0.3 | 0.3 | |
1.5 | 3.5 | 6.2 | 3.2 |
由 (16.163d) 可推出
且 (16.163e) 式为
4. 注
(1) 为确定回归系数,使用插值
当
(2) 在多元情形下,也可以使用
(3) 借助于