浅谈pytorch grad_fn以及权重梯度不更新的问题

脚本专栏 2024/11/5 佚名

3 2 1

圆月山庄资源网 Design By www.vgjia.com

前提：我训练的是二分类网络，使用语言为pytorch

Varibale包含三个属性：

data：存储了Tensor，是本体的数据

grad：保存了data的梯度，本事是个Variable而非Tensor，与data形状一致

grad_fn：指向Function对象，用于反向传播的梯度计算之用

在构建网络时，刚开始的错误为：没有可以grad_fn属性的变量。

百度后得知要对需要进行迭代更新的变量设置requires_grad=True ，操作如下：

train_pred = Variable(train_pred.float(), requires_grad=True)`

这样设置之后网络是跑起来了，但是准确率一直没有提升，很明显可以看出网络什么都没学到。

我输出 model.parameters() (网络内部的权重和偏置)查看，发现它的权重并没有更新，一直是同一个值，至此可以肯定网络什么都没学到，还是迭代那里出了问题。

询问同门后发现问题不在这里。

计算loss时，target与train_pred的size不匹配，我以以下操作修改了train_pred，使两者尺寸一致，才导致了上述问题。

  train_pred = model(data)
  train_pred = torch.max(train_pred, 1)[1].data.squeeze()
  train_pred = Variable(train_pred.float(), requires_grad=False)
  train_loss = F.binary_cross_entropy(validation_pred.float(), target)
  train_loss.backward()

对train_pred多次处理后，它已无法正确地反向传播，实际上应该更改target，使其与train_pred size一致。

重点！！！要想loss正确反向传播，应直接将model(data)传入loss函数。

最终修改代码如下：

 for batch_idx, (data, target) in enumerate(train_loader):
  # Get Samples
  label = target.view(target.size(0), 1).long()
  target_onehot = torch.zeros(data.shape[0], args.num_classes).scatter_(1, label, 1)
  data, target_onehot = Variable(data.cuda()), Variable(target_onehot.cuda().float())
  
  model.zero_grad()

  # Predict
  train_pred = model(data)
  train_loss = F.binary_cross_entropy(train_pred, target_onehot)
  train_loss.backward()
  optimizer.step()

以上这篇浅谈pytorch grad_fn以及权重梯度不更新的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

pytorch,grad_fn,权重,梯度,不更新

标签：

pytorch,grad_fn,权重,梯度,不更新

圆月山庄资源网 Design By www.vgjia.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

圆月山庄资源网 Design By www.vgjia.com

评论“浅谈pytorch grad_fn以及权重梯度不更新的问题”

暂无评论...

www.vgjia.com 圆月山庄资源网

139,976互联网资源

144,792高清电影

21,817无损音乐

631,128技术资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2024/11/5

可与Spreadsheets媲美的在线表格系统:EditG

2024/11/5

cygwin使用心得

2024/11/5

脚本的DVD开发

2024/11/5

局域网设置自动配置脚本文件的写法与用途

2024/11/5

一句话新闻

一口气升级7个大模型SaaS应用，百度智能云：突出一个“开箱即用” - 2024/11/5

这一波大模型产业落地浪潮里，不少企业其实处在 “干瞪眼“的状态。

一种情况是，很多大模型产品看得见却摸不着，在台上一个个遥遥领先——今天Sora技精四座，明天英伟达的机器人又赢得满堂彩，可是到了台下一问：啥时候能用上啊？答曰：遥遥无期。

另一种情况是，企业想用上大模型，却又难免瞻前顾后——既要考虑场景融合，又得兼顾安全性，还要考虑打通现有系统，再加上各种部署成本和繁琐的采购流程……最后只能拂袖：罢了，再等等吧。

稳了！魔兽国服回归的3条重磅消息！官宣时间再确认！

昨天有一位朋友在大神群里分享，自己亚服账号被封号之后居然弹出了国服的封号信息对话框。

这里面让他访问的是一个国服的战网网址，com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后，确实是网易的网址，也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情，因为以前都没有出现这样的情况，现在突然提示跳转到国服战网的网址，是不是说明了简体中文客户端已经开始进行更新了呢？

更新日志

2024年11月05日

浅谈pytorch grad_fn以及权重梯度不更新的问题

pytorch,grad_fn,权重,梯度,不更新

django 配置阿里云OSS存储media文件的例子

python数据类型之间怎么转换技巧分享

评论“浅谈pytorch grad_fn以及权重梯度不更新的问题”

稳了！魔兽国服回归的3条重磅消息！官宣时间再确认！

更新日志

友情链接