白化
From Ufldl
Line 113: | Line 113: | ||
:【原文】: | :【原文】: | ||
+ | :ZCA Whitening | ||
+ | Finally, it turns out that this way of getting the | ||
+ | data to have covariance identity <math>\textstyle I</math> isn't unique. | ||
+ | Concretely, if | ||
+ | <math>\textstyle R</math> is any orthogonal matrix, so that it satisfies <math>\textstyle RR^T = R^TR = I</math> (less formally, | ||
+ | if <math>\textstyle R</math> is a rotation/reflection matrix), | ||
+ | then <math>\textstyle R \,x_{\rm PCAwhite}</math> will also have identity covariance. | ||
+ | In '''ZCA whitening''', | ||
+ | we choose <math>\textstyle R = U</math>. We define | ||
+ | :<math>\begin{align} | ||
+ | x_{\rm ZCAwhite} = U x_{\rm PCAwhite} | ||
+ | \end{align}</math> | ||
+ | Plotting <math>\textstyle x_{\rm ZCAwhite}</math>, we get: | ||
+ | [[File:ZCA-whitened.png | 600px]] | ||
+ | |||
+ | It can be shown that out of all possible choices for <math>\textstyle R</math>, | ||
+ | this choice of rotation causes <math>\textstyle x_{\rm ZCAwhite}</math> to be as close as possible to the | ||
+ | original input data <math>\textstyle x</math>. | ||
+ | |||
+ | When using ZCA whitening (unlike PCA whitening), we usually keep all <math>\textstyle n</math> dimensions | ||
+ | of the data, and do not try to reduce its dimension. | ||
:【初译】: | :【初译】: | ||
+ | 最后,事实证明使数据的协方差矩阵为单位矩阵<math>\textstyle I</math>的方式并不唯一。具体地,如果<math>\textstyle R</math>是任意正交矩阵,即满足<math>\textstyle RR^T = R^TR = I</math>(不太正式地讲,若<math>\textstyle R</math>是旋转/反射矩阵), 那么<math>\textstyle R \,x_{\rm PCAwhite}</math>具有单位协方差。在 ZCA白化中,令<math>\textstyle R = U</math>.我们定义: | ||
+ | :<math>\begin{align} | ||
+ | x_{\rm ZCAwhite} = U x_{\rm PCAwhite} | ||
+ | \end{align}</math> | ||
+ | 绘制<math>\textstyle x_{\rm ZCAwhite}</math>,得到: | ||
+ | |||
+ | 可以看到,对所有可能的<math>\textstyle R</math>,这种旋转使得<math>\textstyle R</math>尽可能地接近原始输入数据<math>\textstyle x</math>. | ||
+ | 当使用 ZCA白化时(不同于 PCA白化),我们通常保留数据的全部<math>\textstyle n</math>个维度,不尝试去降低它的维数。 | ||
:【一校】: | :【一校】: | ||
+ | 最后要说明的是,使数据的协方差矩阵变为单位矩阵<math>\textstyle I</math>的方式并不唯一。具体地,如果<math>\textstyle R</math>是任意正交矩阵,即满足<math>\textstyle RR^T = R^TR = I</math>(不太正式地讲,<math>\textstyle R</math>是旋转或反射矩阵), 那么<math>\textstyle R \,x_{\rm PCAwhite}</math>仍然具有单位协方差。在 ZCA白化中,令<math>\textstyle R = U</math>.我们定义ZCA白化的结果为: | ||
+ | :<math>\begin{align} | ||
+ | x_{\rm ZCAwhite} = U x_{\rm PCAwhite} | ||
+ | \end{align}</math> | ||
+ | |||
+ | 绘制<math>\textstyle x_{\rm ZCAwhite}</math>,得到: | ||
+ | 可以证明,对所有可能的<math>\textstyle R</math>,这种旋转使得<math>\textstyle R</math>尽可能地接近原始输入数据<math>\textstyle x</math>. | ||
+ | 当使用 ZCA白化时(不同于 PCA白化),我们通常保留数据的全部<math>\textstyle n</math>个维度,不尝试去降低它的维数。 | ||
:【原文】: | :【原文】: |