主成分分析
From Ufldl
(→Number of components to retain 选择主成分个数) |
(→Recovering an Approximation of the Data 数据还原) |
||
Line 371: | Line 371: | ||
by <math>\textstyle U</math> to get our approximation to <math>\textstyle x</math>. Concretely, we get | by <math>\textstyle U</math> to get our approximation to <math>\textstyle x</math>. Concretely, we get | ||
- | 【初译】:经过上一步骤,我们得到了对应原始数据<math>\textstyle | + | 【初译】:经过上一步骤,我们得到了对应原始数据<math>\textstyle x \in \Re^n</math>的低维“压缩”表征量<math>\textstyle \tilde{x} \in \Re^k</math>,反过来,如果给定<math>\textstyle \tilde{x}</math>,我们应如何尽可能地还原原始数据<math>\textstyle \hat{x}</math>呢?由本章第三节可知<math>\textstyle x = U x_{\rm rot}</math>,且<math>\textstyle \tilde{x}</math>可以看作<math>\textstyle x_{\rm rot}</math>的近似值,因为<math>\textstyle \tilde{x}</math>只是将<math>\textstyle x_{\rm rot}</math>最后的<math>\textstyle n-k</math>个元素用0代替并省略而得到,因此如果给定<math>\textstyle \tilde{x} \in \Re^k</math>,可以通过在其末尾添加<math>\textstyle n-k</math>个0来得到<math>\textstyle x_{\rm rot} \in \Re^n</math>的近似,接着用<math>\textstyle U</math>左乘该<math>\textstyle x_{\rm rot}</math>近似值便可得到对原数据<math>\textstyle x</math>的近似还原。具体来说,我们需进行如下计算: |
- | + | 【一审】:现在,<math>\textstyle \tilde{x} \in \Re^k</math>成为<math>\textstyle x \in \Re^n</math>在低维空间的一个“压缩”表征。 反过来,如果给定<math>\textstyle \tilde{x}</math>,我们应如何尽可能地还原原始数据<math>\textstyle \hat{x}</math>呢?由本章第三节可知<math>\textstyle x = U x_{\rm rot}</math>,且<math>\textstyle \tilde{x}</math>可以看作<math>\textstyle x_{\rm rot}</math>的近似值,因为<math>\textstyle \tilde{x}</math>只是将<math>\textstyle x_{\rm rot}</math>最后的<math>\textstyle n-k</math>个元素用0代替并省略而得到,因此如果给定<math>\textstyle \tilde{x} \in \Re^k</math>,可以通过在其末尾添加<math>\textstyle n-k</math>个0来得到<math>\textstyle x_{\rm rot} \in \Re^n</math>的近似,接着用<math>\textstyle U</math>左乘该<math>\textstyle x_{\rm rot}</math>近似值便可得到对原数据<math>\textstyle x</math>的近似还原。具体来说,我们需进行如下计算: | |
【二审】: | 【二审】: | ||
Line 391: | Line 391: | ||
【初译】:该式中的第二个等号由先前对<math>\textstyle U</math>的定义可知成立,(在实际应用时,我们不倾向于先给<math>\textstyle \tilde{x}</math>填0然后再左乘<math>\textstyle U</math>,因为这样意味着大量的乘0运算,相反我们选择用<math>\textstyle U</math>的前<math>\textstyle k</math>列来乘<math>\textstyle \tilde{x} \in \Re^k</math>,其结果也即等于上面式子中最右边项。)将该算法应用到本章节的样例数据集,我们可以得到以下关于<math>\textstyle \hat{x}</math>的作图: | 【初译】:该式中的第二个等号由先前对<math>\textstyle U</math>的定义可知成立,(在实际应用时,我们不倾向于先给<math>\textstyle \tilde{x}</math>填0然后再左乘<math>\textstyle U</math>,因为这样意味着大量的乘0运算,相反我们选择用<math>\textstyle U</math>的前<math>\textstyle k</math>列来乘<math>\textstyle \tilde{x} \in \Re^k</math>,其结果也即等于上面式子中最右边项。)将该算法应用到本章节的样例数据集,我们可以得到以下关于<math>\textstyle \hat{x}</math>的作图: | ||
- | + | 【一审】:上面的等式来源于先前对<math>\textstyle U</math>的定义,(在实际应用时,我们不倾向于先给<math>\textstyle \tilde{x}</math>填0然后再左乘<math>\textstyle U</math>,因为这样意味着大量的乘0运算,相反我们选择用<math>\textstyle U</math>的前<math>\textstyle k</math>列来乘<math>\textstyle \tilde{x} \in \Re^k</math>,其结果也即等于上面式子中最右边项。)将该算法应用到本章节的样例数据集,我们可以得到以下关于<math>\textstyle \hat{x}</math>的图示: | |
【二审】: | 【二审】: | ||
Line 415: | Line 415: | ||
【二审】: | 【二审】: | ||
- | |||
== Number of components to retain 选择主成分个数 == | == Number of components to retain 选择主成分个数 == |