数据预处理
From Ufldl
Line 73: | Line 73: | ||
对于彩色图像,色彩通道间并不存在平稳特性。因此我们通常首先对数据进行特征缩放(使像素值位于<math>[0, 1]</math>区间),然后使用足够大的<tt>epsilon</tt>来做PCA/ZCA。注意在进行PCA变换前需要对特征进行分量均值归零化。 | 对于彩色图像,色彩通道间并不存在平稳特性。因此我们通常首先对数据进行特征缩放(使像素值位于<math>[0, 1]</math>区间),然后使用足够大的<tt>epsilon</tt>来做PCA/ZCA。注意在进行PCA变换前需要对特征进行分量均值归零化。 | ||
- | === | + | === 音频 (MFCC/频谱图) === |
- | + | 对于音频数据 (MFCC 和频谱图),每一维度的取值范围(方差)不同。例如MFCC的第一分量是直流分量,通常其幅度远大于其他分量,尤其当特征中包含时域导数(temporal derivatives)时(这是音频处理中的常用方法)更是如此。因此,对这类数据的预处理通常从简单的数据标准化开始(即使得数据的每一维度均值为零、方差为1),然后进行PCA/ZCA白化(使用合适的<tt>epsilon</tt>)。 | |
- | + | ||
- | + | === MNIST 手写数字 === | |
- | + | MNIST数据集的像素值在 <math>[0, 255]</math>区间中。我们首先将其缩放到<math>[0, 1]</math>区间。实际上,进行逐样本均值消去也有助于特征学习。''注:也可选择以对MNIST进行PCA/ZCA白化,但这在实践中不常用。'' | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | === | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | MNIST数据集的像素值在 <math>[0, 255]</math>区间中。我们首先将其缩放到<math>[0, 1]</math> | + |