问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

权重初始化方法

发布网友 发布时间:2022-12-26 17:27

我来回答

1个回答

热心网友 时间:2023-06-28 04:48

常用的初始化方法:全0初始化、随机初始化

在线性回归、逻辑回归这类简单模型中全0初始化一般是work的;但在深度模型中全0初始化会导致每层的参数都一样,反向传播梯度也一样,没有意义。

深度模型中一般都能用,但有缺陷:随机数生成其实也是在均值为0、方差为1的高斯分布中采样,当神经网络的层数增多,激活函数(tanh)的输出值越接近0,会导致梯度非常接近0,然后梯度消失

用相似场景pretrain的模型,加载参数信息到需要训练的新模型中

基本思想:保持输入和输出的方差一致,避免所有输出值都趋向于0(var=1/n)

针对Xavier在ReLU的后面层仍然无法避免输出值趋近于0的情况提出的初始化方法(var=2/n)
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
为什么来大姨妈胸会胀 少儿学什么舞蹈 青年学什么舞蹈好 成年人学什么舞蹈 福州企业最低工资标准 2013年厦门的底薪是多少 生产要素的需求有哪些性质 生产要素的需求有何特点? 什么是生产要素需求 微观经济学要素需求什么是条件要素需求?它和要素需求有什么不同?_百度... 扬百利杨梅酵素饮料能通便吗? 来电呼叫转移怎么取消 移动取消呼叫转移 怎么筛选微博同时关注几个人的人 怎么找回10年前的冒险岛号 氢福来正规吗 新枫之谷身份证可以认证几个号 枫之谷m怎么切换账号 新枫之谷账号封了会怎么样 枫之谷m怎么切换帐号登录游戏 uv膜贴完以后屏幕飘 华为madepadpro11贴了钢化膜之后会不清晰 为啥自己的手机贴膜没有别人的清楚 iphone刚换完电池贴膜不清晰 电脑投影仪投不出来是怎么办 猎场最后为什么没去接孙红雷 梦见自己被别人打了是什么意思 梦见自己被别人打预示着什么?有什么特殊意思? PSP麻将格斗 明明是我赢了,可为什么就是和不了 卡西欧手表链怎么拆卸 你觉得选角有问题的电视剧有哪些? 新开的加好友多了会被说恶意营销么? 刚刚注册的微信为啥添加八个好友会被封号呢? 为什么手机充电时不能接电话? 商业贷款最长贷多少年? 烧烤师一月多少钱 新买的土蜂蜜要怎么保存好 为什么复制粘贴只有一行? 私人以官者浮凌下取胜者侵什么意思 浅解《素书》 凌下取胜者侵 名不胜实者耗 素书全鉴(32) 形容企业强大的两个字词语,开拓,进取,雄厚 dhcp租用期的单位是什么 动态主机配置协议DHCP 只因为在天涯等着你是什么歌 歌词里面有等着你爱着你是什么歌歌名叫什么是由哪一位女歌手唱的 螺丝坏了怎样把它拧出来? 文化用品商店怎么点库 安化县进文具批发市场在哪里进货 我想问一下,这个蛋糕发霉了吗?闻起来有一种怪味,这个星期一买的,保质期是4天。还可以食用吗?