- 一个正交化线性变换,把数据变换到一个新的坐标系统中,使得这一数据的任何投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
- 目的——数据降维
- **——将n维特征映射到k维上(k<n),这k维是全新的正交特征。
- 这k维特征称为主成分。
- 是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。
期望(一阶原点矩) $$ \bar{f(X)} = E[f(x)] = \int{dxf(x)P_x(x)} $$ 方差(二阶中心矩) $$ \sigma^2 = E[(X-\bar{X})^2] = \bar(X^2)-\bar(x)^2 $$