深度网络概览

From Ufldl

Jump to: navigation, search

@@ Line 44: / Line 44: @@
 ==逐层贪婪训练方法==
-那么，我们应该如何训练深度网络呢？逐层贪婪训练方法是取得一定成功的方法。我们会在后面的章节中详细阐述这种方法的细节。简单来说，逐层贪婪算法的主要思路是每次只训练网络中的一层，即我们首先训练一个只含一个隐藏层的网络，仅当这层网络训练结束之后才开始训练一个有两个隐藏层的网络，以此类推。在每一步中，我们把已经训练好的前 <math>\textstyle k-1 </math> 层固定，然后增加第 <math>\textstyle k </math> 层（也就是将我们已经训练好的前 <math>\textstyle k-1 </math> 的输出作为输入）。每一层的训练可以是有监督的（例如，将每一步的分类误差作为目标函数），但更通常使用无监督方法（例如自动编码器，我们会在后边的章节中给出细节）。这些各层单独训练所得到的权重被用来初始化最终（或者说全部）的深度网络的权重，然后对整个网络进行“微调”（即把所有层放在一起来优化有标签训练集上的训练误差）.
+那么，我们应该如何训练深度网络呢？逐层贪婪训练方法是取得一定成功的一种方法。我们会在后面的章节中详细阐述这种方法的细节。简单来说，逐层贪婪算法的主要思路是每次只训练网络中的一层，即我们首先训练一个只含一个隐藏层的网络，仅当这层网络训练结束之后才开始训练一个有两个隐藏层的网络，以此类推。在每一步中，我们把已经训练好的前 <math>\textstyle k-1 </math> 层固定，然后增加第 <math>\textstyle k </math> 层（也就是将我们已经训练好的前 <math>\textstyle k-1 </math> 的输出作为输入）。每一层的训练可以是有监督的（例如，将每一步的分类误差作为目标函数），但更通常使用无监督方法（例如自动编码器，我们会在后边的章节中给出细节）。这些各层单独训练所得到的权重被用来初始化最终（或者说全部）的深度网络的权重，然后对整个网络进行“微调”（即把所有层放在一起来优化有标签训练集上的训练误差）.
@@ Line 61: / Line 61: @@
 在下一节中，我们将会具体阐述如何进行逐层贪婪训练。
 ==翻译人员==

深度网络概览

From Ufldl

Revision as of 15:16, 29 March 2013

Views

Personal tools

ufldl resources

wiki

Search

Toolbox