38. 开始时有一个停滞期,这是因为神经网络在进入全局最小值之前陷入局部最小值。
为了避免这种情况,下面的哪个策略有效?( )
增加参数的数量,因为网络不会卡在局部最小值处
在开始时把学习率降低10倍,然后使用梯度下降加速算子(momentum)
抖动学习速率,即改变几个时期的学习速率
以上均不是
“抖动学习速率,即改变几个时期的学习速率”可以将陷于局部最小值的神经网络提取出来。
38. 开始时有一个停滞期,这是因为神经网络在进入全局最小值之前陷入局部最小值。
为了避免这种情况,下面的哪个策略有效?( )
增加参数的数量,因为网络不会卡在局部最小值处
在开始时把学习率降低10倍,然后使用梯度下降加速算子(momentum)
抖动学习速率,即改变几个时期的学习速率
以上均不是