关注
别的不懂,但是从Andrew的deeplearning的第五课第一章第三个作业中抽取点个人感受。 你把编曲想成简单的one-to-many的sequence model,预测下一个词,那么我们使用简单单层的RNN+LSTM(假定你理解RNN和LSTM的原理)就可以像做sequence predicting一样预测下一个可能出现的音符或者音阶。那再来说你的贴图,贴图是深层的RNN+LSTM的一个时间片结构,这里多层是因为对于一个输入,假定输入是embedding或是one-hot的形式,那么决定这个输入的下一个音符或者音阶的softmax对于输入可能不是线性的,这和普通的深层神经网络原理类似,比如,输入猫的图片,决策是不是猫的概率是隐层叠出来的非线性特征所决定的一样。那么综合起来看,我们采用RNN+LSTM的结构是因为不同音符之间有很强的联系,采用深层网络是想学到非线性特征。 比如一个歌手的风格是情歌,那么他的曲风可能偏向R&B、乡村、或者蓝调等,根据他的曲库,我们可以使用这种结构学到一种可能比较柔情的pattern。但是当哪天过气了,想要来个rap炸一炸,可能这种网络效果就不会好了,他都过气了,别说那个当年适合他的网络了。。。。。。
查看原帖
点赞 2
牛客热帖
更多
正在热议
更多
# 秋招签约后的心态变化 #
81853次浏览 807人参与
# 你觉得早上几点上班合适? #
71736次浏览 299人参与
# 学历贬值真的很严重吗? #
23840次浏览 169人参与
# 26届的你们有几段实习? #
41827次浏览 469人参与
# 哪些公司真双非友好? #
15489次浏览 82人参与
# 月薪多少能在一线城市生存 #
25079次浏览 288人参与
# 打工人的工作餐日常 #
52540次浏览 411人参与
# 你以为的实习VS真实的实习 #
27271次浏览 252人参与
# 双非能在秋招上岸吗? #
221318次浏览 1170人参与
# 你后悔自己读研吗? #
19052次浏览 234人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
117593次浏览 812人参与
# 一人推荐一个值得去的通信/硬件公司 #
186204次浏览 1858人参与
# 追觅科技求职进展汇总 #
18015次浏览 120人参与
# 机械校招之路总结 #
93767次浏览 1894人参与
# 你认为哪些项目算烂大街? #
17088次浏览 269人参与
# 如何KTV领导 #
62583次浏览 472人参与
# 秋招拿一个offer可以躺平吗 #
146298次浏览 942人参与
# 你被哪些公司秒挂过? #
31031次浏览 240人参与
# 找工作时的取与舍 #
82906次浏览 591人参与
# 你觉得技术面多长时间合理? #
99086次浏览 716人参与