深度学习-李沐-第八节-循环神经网络

moye Lv6

循环神经网络



输出发生在观察之前
预测输出


n次交叉熵的平均值

语言模型本质是分类模型 判断下一个词是词典中的类别

困惑度对平均交叉熵做个指数

小结

  • 对隐状态使用循环计算的神经网络称为循环神经网络(RNN)。
  • 循环神经网络的隐状态可以捕获直到当前时间步序列的历史信息。
  • 循环神经网络模型的参数数量不会随着时间步的增加而增加。
  • 我们可以使用循环神经网络创建字符级语言模型。
  • 我们可以使用困惑度来评价语言模型的质量。
  • RNN的输出取决于当下输入和前一时间的隐变量
  • 应用到语言模型中,RNN根据当前词预测下一时刻词
  • 通常使用困惑度来衡量语言模型的好坏
  • 标题: 深度学习-李沐-第八节-循环神经网络
  • 作者: moye
  • 创建于 : 2022-08-16 15:00:46
  • 更新于 : 2025-12-11 14:39:48
  • 链接: https://www.kanes.top/2022/08/16/深度学习-李沐-第八节-循环神经网络/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论
目录
深度学习-李沐-第八节-循环神经网络