一个关于主成分得分的讨论，稍具争议。请统计大佬指路。

jiewenji 发表于 2022-2-25 11:47:08

本帖最后由 jiewenji 于 2022-2-25 11:51 编辑

请看下图，我在一篇论文中的确看到了应用主成分得分的方法对样本排序，当时就觉得很奇怪，为什么方差越大的主成分给的权重就越大，这样做的理论依据是什么？想达到什么目的？
关于下图中的内容我有如下疑问，原文引用基本都来自书中划线部分。

1，“ 而仅是体现在数据的变异性上，把反映数据变异性信息的前m个主成分线性组合起来将会瓦解主成分在变异性信息上的优势，”-----既然主成分反映了数据的变异性，为什么把它们线性组合起来，反而破坏了变异性上的优势？

2，“ 这是因为，原始变量的含义是实在的、确切的,这是看懂和理解线性组合含义的基础;而主成分是人为定义、意义含糊的”----------我也有这种感觉，觉得主成分意义模糊。但是否有针对性的方法克服上述障碍呢？总不能让主成分分析的结果闲置吧。

其次，大家是否有专门讨论“主成分分析结果如何应用”的书籍或文章推荐？（不涉及如何计算主成分）。

摘自上海财经大学王学民老师应用多元统计分析

页: [1]

数学研发论坛's Archiver

一个关于主成分得分的讨论，稍具争议。请统计大佬指路。