问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何修改tensorflow中alexnet

发布网友 发布时间:2022-04-26 20:14

我来回答

1个回答

热心网友 时间:2023-10-28 02:09

我们利用 TensorFlow 提供的 tf.train.AdamOptimizer 来控制学习速度。AdamOptimizer 通过使用动量(参数的移动平均数)来改善传统梯度下降,促进超参数动态调整。我们可以通过创建标签错误率的摘要标量来跟踪丢失和错误率:
# Create a placeholder for the summary statistics
with tf.name_scope("accuracy"):
# Compute the edit (Levenshtein) distance of the top path
distance =tf.edit_distance(tf.cast(self.decoded[0], tf.int32), self.targets)
# Compute the label error rate (accuracy)
self.ler =tf.rece_mean(distance, name='label_error_rate')
self.ler_placeholder =tf.placeholder(dtype=tf.float32, shape=[])
self.train_ler_op =tf.summary.scalar("train_label_error_rate", self.ler_placeholder)
self.dev_ler_op =tf.summary.scalar("validation_label_error_rate", self.ler_placeholder)
self.test_ler_op =tf.summary.scalar("test_label_error_rate", self.ler_placeholder)
如何改进 RNN
现在我们构建了一个简单的 LSTM RNN 网络,下一个问题是:如何继续改进它?幸运的是,在开源社区里,很多大公司都开源了自己的最新语音识别模型。在 2016 年 9 月,微软的论文《The Microsoft 2016 Conversational Speech Recognition System》展示了在 NIST 200 Switchboard 数据中单系统残差网络错误率 6.9% 的新方式。他们在卷积+循环神经网络上使用了几种不同的声学和语言模型。微软的团队和其他研究人员在过去 4 年中做出的主要改进包括:

在基于字符的 RNN 上使用语言模型

使用卷积神经网络(CNN)从音频中获取特征

使用多个 RNN 模型组合

值得注意的是,在过去几十年里传统语音识别模型获得的研究成果,在目前的深度学习语音识别模型中仍然扮演着自己的角色。

修改自: A Historical Perspective of Speech Recognition, Xuedong Huang, James Baker, Raj Reddy Communications of the ACM, Vol. 57 No. 1, Pages 94-103, 2014
训练你的第一个 RNN 模型
在本教程的 Github 里,作者提供了一些介绍以帮助读者在 TensorFlow 中使用 RNN 和 CTC 损失函数训练端到端语音识别系统。大部分事例数据来自 LibriVox。数据被分别存放于以下文件夹中:

Train: train-clean-100-wav (5 examples)

Test: test-clean-wav (2 examples)

Dev: dev-clean-wav (2 examples)

当训练这些示例数据时,你会很快注意到训练数据的词错率(WER)会产生过拟合,而在测试和开发集中词错率则有 85% 左右。词错率不是 100% 的原因在于每个字母有 29 种可能性(a-z、逗号、空格和空白),神经网络很快就能学会:

某些字符(e,a,空格,r,s,t)比其他的更常见

辅音-元音-辅音是英文的构词特征

MFCC 输入声音信号振幅特征的增加只与字母 a-z 有关

热心网友 时间:2023-10-28 02:09

我们利用 TensorFlow 提供的 tf.train.AdamOptimizer 来控制学习速度。AdamOptimizer 通过使用动量(参数的移动平均数)来改善传统梯度下降,促进超参数动态调整。我们可以通过创建标签错误率的摘要标量来跟踪丢失和错误率:
# Create a placeholder for the summary statistics
with tf.name_scope("accuracy"):
# Compute the edit (Levenshtein) distance of the top path
distance =tf.edit_distance(tf.cast(self.decoded[0], tf.int32), self.targets)
# Compute the label error rate (accuracy)
self.ler =tf.rece_mean(distance, name='label_error_rate')
self.ler_placeholder =tf.placeholder(dtype=tf.float32, shape=[])
self.train_ler_op =tf.summary.scalar("train_label_error_rate", self.ler_placeholder)
self.dev_ler_op =tf.summary.scalar("validation_label_error_rate", self.ler_placeholder)
self.test_ler_op =tf.summary.scalar("test_label_error_rate", self.ler_placeholder)
如何改进 RNN
现在我们构建了一个简单的 LSTM RNN 网络,下一个问题是:如何继续改进它?幸运的是,在开源社区里,很多大公司都开源了自己的最新语音识别模型。在 2016 年 9 月,微软的论文《The Microsoft 2016 Conversational Speech Recognition System》展示了在 NIST 200 Switchboard 数据中单系统残差网络错误率 6.9% 的新方式。他们在卷积+循环神经网络上使用了几种不同的声学和语言模型。微软的团队和其他研究人员在过去 4 年中做出的主要改进包括:

在基于字符的 RNN 上使用语言模型

使用卷积神经网络(CNN)从音频中获取特征

使用多个 RNN 模型组合

值得注意的是,在过去几十年里传统语音识别模型获得的研究成果,在目前的深度学习语音识别模型中仍然扮演着自己的角色。

修改自: A Historical Perspective of Speech Recognition, Xuedong Huang, James Baker, Raj Reddy Communications of the ACM, Vol. 57 No. 1, Pages 94-103, 2014
训练你的第一个 RNN 模型
在本教程的 Github 里,作者提供了一些介绍以帮助读者在 TensorFlow 中使用 RNN 和 CTC 损失函数训练端到端语音识别系统。大部分事例数据来自 LibriVox。数据被分别存放于以下文件夹中:

Train: train-clean-100-wav (5 examples)

Test: test-clean-wav (2 examples)

Dev: dev-clean-wav (2 examples)

当训练这些示例数据时,你会很快注意到训练数据的词错率(WER)会产生过拟合,而在测试和开发集中词错率则有 85% 左右。词错率不是 100% 的原因在于每个字母有 29 种可能性(a-z、逗号、空格和空白),神经网络很快就能学会:

某些字符(e,a,空格,r,s,t)比其他的更常见

辅音-元音-辅音是英文的构词特征

MFCC 输入声音信号振幅特征的增加只与字母 a-z 有关
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
单位高温防护欠缺致员工中暑如何对待 狗狗为什么爱看视频 360浏览器怎么设置倍速播放 ...先讲女主的灵魂飘荡了一段时间,然后重生,请问是那本? 拯救者散热器怎么开 电脑如何一键还原系统电脑一键还原怎么操作 神舟笔记本电脑怎么重新设置神舟战神bios恢复出厂设置 神舟电脑恢复出厂设置神舟战神怎么恢复原厂系统 水泥楼梯如何铺木楼梯 家里面楼梯是水泥的不想铺地毯或者地砖还能铺什么 铜的水龙头是58铜做的吗? tensorflow2.0线性回归求X值 如何在ubuntu装tensorflow tensorflow 如何在线训练模型 孕期体重增长过快怎么控制?孕期减肥谁有办法? 醋酸泼尼松片,吃了有什么副作用,是不是头会变大长胖,胖了怎么减肥 怎样把网站上的歌曲、电影下载到MP4里? 疫情期间,长了那么多肉,减不掉怎么办? 怎样下载浏览器网页看到的视频和音乐,详情 17下面长才接近13正常吗,本人230斤,减肥以后会不会变大还有没有发育空间了 年龄越大越容易长肉,30以后的女人吃什么减肥 为什么说运动减肥是最大的骗局? 如何下载在网页上播放的音乐或者视频? 什么东西吃了长肉,减肥期间不能吃什么美食? 天冷没运动长胖了,怎么减肥好啊?重庆减肥好方法有哪些呢? 肚子大有什么办法减肥啊? 最近发胖,肚子大,还有肉都长脸上了.怎么减肥 怎么下载网页上面播放的音乐和视频 我的汤姆猫礼品代码是多少? 怎么样可以有效的减肥???时间长点也行 淘宝拍卖拍了1个水龙头120元,说是全铜的,会贵吗?卖家说还亏的,搞活动卖197。 不锈钢水龙头和全铜水龙头哪个好? 水龙头怎么辨别是铜的 手机美图软件,有没有能把普通照片弄成浮雕效果的。(美图秀秀现在没有这个功能了) 如何查找国际学术会议信息 如何检索某学术会议全部论文? 这种照片用picsart软件怎么做出来? 在什么网站上可以获取最新学术交流会议信息 若查找国内外各种学术会议的信息,可以利用哪些检索工具 朗诵时最好穿什么样的服装 会议论文的检索字段包括哪些? Libra学术搜索的功能与特点 朗诵比赛选定《祖国啊,我亲爱的祖国》,该用什么配乐,穿怎样款式的服装? 大学生朗诵致橡树时应该穿什么样的衣服? 我有个朗诵比赛,朗诵的内容是《相信未来》,但是不知道该配什么衣服,是配五四学生装呢,还是深蓝色的晚 大学生2男2女参加经典古诗文朗诵比赛(将进酒),服装,鞋子怎么穿? 诗歌朗诵我的南方和北方比赛穿什么服装最好 大学生朗诵比赛《勿忘国耻,振兴中华》,服装穿什么好?除了*学生装? 女生单独朗诵五四诗歌,穿什么服装显得比较大方、得体? 四个大学生女生朗诵《祖国啊!我亲爱的祖国》要穿什么衣服