Moye活着的记录

深度学习-李沐-第十三节-微调

moye Lv6

2022-08-16 15:46 2022-08-16 15:46 创建 2025-12-12 18:22:53 2025-12-12 18:22:53 更新

深度学习

微调

微调步骤

在源数据集（例如ImageNet数据集）上预训练神经网络模型，即源模型。
创建一个新的神经网络模型，即目标模型。这将复制源模型上的所有模型设计及其参数（输出层除外）。我们假定这些模型参数包含从源数据集中学到的知识，这些知识也将适用于目标数据集。我们还假设源模型的输出层与源数据集的标签密切相关；因此不在目标模型中使用该层。
向目标模型添加输出层，其输出数是目标数据集中的类别数。然后随机初始化该层的模型参数。
在目标数据集（如椅子数据集）上训练目标模型。输出层将从头开始进行训练，而所有其他层的参数将根据源模型的参数进行微调。

代码实现

Chapter13计算机视觉/热狗识别.ipynb

小结

迁移学习将从源数据集中学到的知识“迁移”到目标数据集，微调是迁移学习的常见技巧。
除输出层外，目标模型从源模型中复制所有模型设计及其参数，并根据目标数据集对这些参数进行微调。但是，目标模型的输出层需要从头开始训练。
通常，微调参数使用较小的学习率，而从头开始训练输出层可以使用更大的学习率。

标题: 深度学习-李沐-第十三节-微调
作者: moye
创建于 : 2022-08-16 15:00:46
更新于 : 2025-12-12 18:22:53
链接: https://www.kanes.top/2022/08/16/深度学习-李沐-第十三节-微调/
版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。

评论

目录

深度学习-李沐-第十三节-微调

1. 微调