主成分分析得到的新坐标系为什么会是所有可能坐标系中坐标轴方差最大的?
本帖最后由 jiewenji 于 2022-2-22 20:47 编辑请看下图蓝线部分,为什么是所有可能坐标系中坐标轴上方差和最大的?我的疑问可以分成递进的几个字问题!
1,在n维正交坐标系中,n维样本数据的方差是不是等于各坐标轴上数据方差之和?
2,如果第一问答案是肯定的,那么当给定样本总数量以后,样本的总方差就确定了= 各坐标轴上数据方差之和=x。那么即便进行了pca变换,但是只要我们选择主成分时确定主成分累计方差率100%(也就是保留全部主成分!),那么样本数据在新的主成分坐标系下,在各个主成分方向坐标轴数据的方差之和不还是=样本的总方差=x么?
也就是说在新旧坐标系下,新旧坐标轴上数据方差之和应该是相等的,何来“是所有可能坐标系中坐标轴上方差和最大的”之说呢?
页:
[1]