多元统计精要:正态分布、参数估计与假设检验
该思维导图涵盖了多元统计的基础知识,包括多元正态分布的定义及其关键性质,样本均值和样本协方差的参数估计方法,假设检验中的Hotelling T²和Wilks' Λ,及多元方差分析的模型和检验方法。还讨论了判别分析的LDA方法、Fisher准则,以及分类规则如马氏距离和Bayes方法,概述了多元统计分析的主要概念和技术手段。
源码
# 多元统计精要
## 1. 多元正态分布
- **定义**: X~N(μ,Σ)
- **关键性质**:
- **线性组合**:
- 线性组合仍正态
- **边缘分布**:
- 边缘分布正态
- **独立性**:
- 独立 ⇔ 协方差为0
## 2. 参数估计
- **样本均值**:
- 公式: $\bar{X}=\frac{1}{n}\sum X_i$
- 特征:
- 无偏性
- 最小方差
- **样本协方差**:
- 公式: $S=\frac{1}{n-1}\sum(X_i-\bar{X})(X_i-\bar{X})^T$
- 特点:
- 描述数据的分布程度
## 3. 假设检验
- **Hotelling T²**:
- 用途: 检验均值向量
- 计算方法: 基于样本均值和协方差
- **Wilks' Λ**:
- 用途: 比较多个总体
- 适用情境: 多个样本均值比较
## 4. 多元方差分析
- **模型**:
- 公式: X = 总体均值 + 处理效应 + 误差
- 组成: 整体均值、不同处理的影响
- **检验方法**:
- Wilks' Λ
- Pillai迹
- Roy最大根
## 5. 判别分析
- **LDA**:
- 目标: 找最优分类方向
- 优势: 提高分类准确性
- **Fisher准则**:
- 方法: 最大化类间/类内方差比
- 公式: $\frac{S_B}{S_W}$
- **分类规则**:
- **马氏距离**:
- 用途: 评估点到分类中心的距离
- **Bayes**:
- 概念: 最小化错误率的分类
图片
