青云测评_人工智能_题目_神经网络基础:NNB085

首页 > 知识中心 > 人工智能 > NNB085

题目级别：工程师【适中】

当数据过大以至于无法在RAM中同时处理时，哪种梯度下降方法更加有效？( )

备选答案

随机梯度下降法(Stochastic Gradient Descent)

不知道

整批梯度下降法(Full Batch Gradient Descent)

都不是

解题分析

梯度下降法分随机梯度下降(每次用一个样本)、小批量梯度下降法(每次用一小批样本算出总损失, 因而反向传播的梯度折中)、全批量梯度下降法则一次性使用全部样本。这三个方法, 对于全体样本的损失函数曲面来说, 梯度指向一个比一个准确. 但是在工程应用中,受到内存/磁盘IO的吞吐性能制约, 若要最小化梯度下降的实际运算时间, 需要在梯度方向准确性和数据传输性能之间取得最好的平衡. 所以, 对于数据过大以至于无法在RAM中同时处理时, RAM每次只能装一个样本, 那么只能选随机梯度下降法。