下面关于注意力机制的描述中,正确的是:( )
于Encoder-Decoder相比,注意力模型中编码器将输入信息编码成一个向量
在计算权重值时,与当前词越近,影响因子越大,权重值越大
Hard Attention会选择整个编码器的输出作为其输入,而Soft Attention则相反
目前研究更倾向于使用Hard Attention, 因为其可以直接求导,进行梯度反向传播
下面关于注意力机制的描述中,正确的是:( )
于Encoder-Decoder相比,注意力模型中编码器将输入信息编码成一个向量
在计算权重值时,与当前词越近,影响因子越大,权重值越大
Hard Attention会选择整个编码器的输出作为其输入,而Soft Attention则相反
目前研究更倾向于使用Hard Attention, 因为其可以直接求导,进行梯度反向传播