主成分分析
From Ufldl
(→Recovering an Approximation of the Data 数据还原) |
(→Recovering an Approximation of the Data 数据还原) |
||
Line 410: | Line 410: | ||
【初译】:由图可看出我们实际上得到的是对原始数据的一维近似。 | 【初译】:由图可看出我们实际上得到的是对原始数据的一维近似。 | ||
如果要训练一个自动编码器(autoencoder)或其它无监督特征学习算法,运算时间将直接依赖于输入数据的维数。若用<math>\textstyle \tilde{x} \in \Re^k</math>取代<math>\textstyle x</math>作为输入数据,那么算法将使用该低维数据进行训练,运行速度也大大加快。对于很多数据集来说,低维表征量<math>\textstyle \tilde{x}</math>都可达到对原数据集的完美近似,因此对这些数据集使用PCA算法将可保证在只产生较小近似误差的同时极大地提速程序。 | 如果要训练一个自动编码器(autoencoder)或其它无监督特征学习算法,运算时间将直接依赖于输入数据的维数。若用<math>\textstyle \tilde{x} \in \Re^k</math>取代<math>\textstyle x</math>作为输入数据,那么算法将使用该低维数据进行训练,运行速度也大大加快。对于很多数据集来说,低维表征量<math>\textstyle \tilde{x}</math>都可达到对原数据集的完美近似,因此对这些数据集使用PCA算法将可保证在只产生较小近似误差的同时极大地提速程序。 | ||
- | |||
【一审】:由上图可看出我们实际上得到的是对原始数据的一维近似。 | 【一审】:由上图可看出我们实际上得到的是对原始数据的一维近似。 |