net.apply(weights_init)的理解

佚名 / 2023-09-01 / 原文

在DCGAN的学习中，Pytorch官方对于权重初始化使用了下列方法

# custom weights initialization called on ``netG`` and ``netD``
def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

在这里对该代码学习后的理解做一些记录。首先是apply(fn)，根据官网解释该方法是Module类的方法，作用是将fn递归地应用于每个子模块（由.children()返回），以及其自身。典型用途便是初始化模型的参数。我们这里来写一个简单的神经网络 net 并将其实例化

def weights_init(m):
    print(m)


net = nn.Sequential(nn.Linear(1, 1), nn.Conv2d(1, 1, 1))

net.apply(weights_init)

我们定义了一个weights_init函数，和一个Sequential类，该类有两层，第一层是全链接层，第二层是卷积层。将该类实例化后调用其apply()方法，我们来运行看看

>>> Linear(in_features=1, out_features=1, bias=True)
Conv2d(1, 1, kernel_size=(1, 1), stride=(1, 1))
Sequential(
  (0): Linear(in_features=1, out_features=1, bias=True)
  (1): Conv2d(1, 1, kernel_size=(1, 1), stride=(1, 1))
)

可以看到apply()遍历了该类的每一层和其自身，我们这里将打印的参数再改成内建参数m.__class__看看

def weights_init(m):
    print(m.__class__)


net = nn.Sequential(nn.Linear(1, 1), nn.Conv2d(1, 1, 1))

net.apply(weights_init)

>>> <class 'torch.nn.modules.linear.Linear'>
<class 'torch.nn.modules.conv.Conv2d'>
<class 'torch.nn.modules.container.Sequential'>

在这里net对象的所在类被递归出来了，最后在把其换成m.__class__.__name__运行

def weights_init(m):
    print(m.__class__.__name__)


net = nn.Sequential(nn.Linear(1, 1), nn.Conv2d(1, 1, 1))

net.apply(weights_init)

>>> Linear
Conv2d
Sequential

可以看出该方法含义是递归神经网络并返回每层名字，如果该名字找到了字符串'Conv'或者'BatchNorm'，则对其权重做归一化

net.apply(weights_init)的理解更多相关文章

【游记】CCPC 济南 2024 游记

python bytecode解析

ansible进阶与自动化

RK3568开发板Openwrt文件系统构建

浅析Dockerhub API：如何优雅地从dockerhub偷rootfs镜像

C# 通过注册表、API两种方式获取显示器的分辨率尺寸

Java-中文官方教程-2022-版-二-

JavaTutorialNetwork-中文系列教程-一-

JavaBeginnersTutorial-中文系列教程-一-

JavaTutorialNetwork-中文系列教程-二-

JavaBeginnersTutorial-中文系列教程-二-

随机推荐

验证码处理在自动化测试中的应用

一些学科笑话

NOIP2024模拟赛20 & 11.1 小记

20241101 数据结构与算法期中机试收获

Java，启动！

什么是IT技术

即将到来！

2024/11/1日日志关于JavaScript简介&引入方式以及基础语法的学习

舍得-时间-工作是人的一生最重要的事情-自己要有私房钱-人的一生最重要的事情是书写自己的人生

2.TiUP 部署 DM 集群

原型模式的C++实现

python bytecode解析

09-XSS键盘监听、cookie窃取&文件上传绕过

ubuntu 24.04 部署 mysql 8.4.3 LTS

国标GB28181公网平台LiteGBS国标GB28181视频平台建筑工地无线视频联网监控系统方案

imes完工下线

android 13 更改手机信号调整

BFS(Breath First Search 广度优先搜索)

Visual Studio Code（VSCode）中设置中文界面

影响黄金价格大幅波动的因素主要有哪些？

net.apply(weights_init)的理解

net.apply(weights_init)的理解更多相关文章

随机推荐

热门话题