2020-07-13 23:58 已编辑贵州水利水电职业技术学院算法工程师

关注

[note] deep learning tensorflow lecture 2 notes 深度学习笔记 (2) 解决过拟合

1. linear model complexity

Logistic Model is defined as: X*W + b = y

parameter W and b should be determined by optimization method.

X is 1 by 784. 784 = 28*28

W is 784 by 10

b is 1 by 10

so number of parameters is 784*10 + 10

2. Rectified Linear Unit (ReLU) and neutron networks

another activation function more like brain activation signal than sigmoid.

picture below shows a two layers neutron networks.

1.The first layer effectively consists of the set of weights and biases applied to X and passed through ReLUs. The output of this layer is fed to the next one, but is not observable outside the network, hence it is known as a hidden layer.
2.The second layer consists of the weights and biases applied to these intermediate outputs, followed by the softmax function to generate probabilities.

3. chain rule

chain rule is a concept in calculus and demonstrates the derivative of a function with a function as its input parameters.

it has efficient data pipeline and lots of data reuse.

4.back propagation

forward propagation computes output y

back propagation computes all derivatives of weight matrices.

then we can update weight by new_weight = weight - alpha*derivative_weight.

back propagation need two times memory and computation than forward propagation.

5. Deep learning networks

在实战(2)中我们实现了一个只有一个隐藏层的神经网络。

其与下图类似。

当然我们可以实现更加深层或更加广度的神经网络。

6.Early termination

在validation data 的准确度达到一定峰值时，要及时结束训练，来避免过拟合。

7. Regularization

将权重向量的2范数引入到loss中，作为惩罚项。

8. Drop out

多层神经网络中，一层的输出可一作为下一层的输入。

drop-out的意思是在上一层输出的节点中随机将选取的一半或其他一部分节点丢弃，并将剩下的节点作为下一层的输入。

当drop-out不起作用时，大概我们需要一个更大的神经网络的了。

使用drop-out有一些小技巧。

(1)在训练时，进行drop-out，并将结果放大两倍

(2)在评估时，不进行drop-out。

全部评论

推荐最新楼层

02-10 10:53

富特科技_项目软件工程师(准入职员工)

步步高内推，步步高内推码

步步高实验学校 2026届校招启动啦【学校简介】东莞市步步高实验学校于 2023 年投入运营，占地 230 亩，是一所集幼儿园、小学、初中、高中于一体的十五年一贯制非营利性高端民办学校，学校全面实行小班化教学，学校师生比为 1:5；步步高教育专家团队由来自一流大学的国家课标专家、教育学家，来自著名学校的卓越校长，来自一线、有着丰富教学经验的著名特级教师，以及来自国家级教育媒体的教育策划专家共同组成，为步步高的课程、教学、管理奠定了坚实基础。【招聘岗位】• 幼儿园、小学部及初中部各学科类教师 & 国际教师，类别多多，等你pick！【福利待遇】• 薪资：幼儿园老师年收入16万起 、中小学教...

点赞评论收藏

分享

02-13 13:23

富特科技_项目软件工程师(准入职员工)

步步高内推，步步高内推码

步步高实验学校 2026届校招启动啦【学校简介】东莞市步步高实验学校于 2023 年投入运营，占地 230 亩，是一所集幼儿园、小学、初中、高中于一体的十五年一贯制非营利性高端民办学校，学校全面实行小班化教学，学校师生比为 1:5；步步高教育专家团队由来自一流大学的国家课标专家、教育学家，来自著名学校的卓越校长，来自一线、有着丰富教学经验的著名特级教师，以及来自国家级教育媒体的教育策划专家共同组成，为步步高的课程、教学、管理奠定了坚实基础。【招聘岗位】• 幼儿园、小学部及初中部各学科类教师 & 国际教师，类别多多，等你pick！【福利待遇】• 薪资：幼儿园老师年收入16万起 、中小学教...

点赞评论收藏

分享

01-31 11:59

蚌埠坦克学院后端工程师

看似0，实则100%

有人零实习也能进大厂，是因为他们手里有比实习更硬的底牌，高学历背景，985、211的毕业证本身就是一块金字招牌，或者丰富的科研经历，发表过高质量的论文，参与过前沿项目，这些都是能力的直接证明；亦或是那些高含金量的奖项，像ACM竞赛的金奖、Kaggle比赛的高排名，这些都能让招聘官一眼相中，当然，家庭背景硬也是一种隐性优势。总之，没有人能够无缘无故的进入大厂，当然家庭背景很硬也是一种能力

不知道怎么取名字_：现在这么卷，0实习能进的，都是有真本事的

为什么有人零实习也能进大...

点赞评论收藏

分享

01-07 17:13

广州大学前端工程师

来点多益笑话

真的没绷住，小心眼这块，这就破防了也是没绷住🤣

优秀的大熊猫在okr...：多益：此贼，必有同谋，按律，该当连坐！

你不能接受的企业文化有哪...

点赞评论收藏

分享

02-16 10:19

门头沟学院 C++

C++ 多线程与并发面试题

1. 进程和线程的区别？答案：进程资源分配的基本单位独立的地址空间进程间通信（IPC）开销大创建销毁开销大线程CPU调度的基本单位共享进程的地址空间线程间通信简单（共享内存）创建销毁开销小对比进程更安全，隔离性好线程更轻量，切换快线程共享资源，需要同步C++中的线程C++11引入std::thread跨平台的线程库RAII风格管理2. 什么是线程安全？如何实现？答案：定义多线程访问时，程序行为正确不会出现数据竞争结果可预测实现方法互斥锁（Mutex）保护临界区同一时间只有一个线程访问读写锁多个读者，一个写者提高并发度原子操作不可分割的操作无需加锁无锁数据结构使用CAS（Compare-And-...

C++面试总结

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客新年AI问运 #

11890次浏览 155人参与

# 实习教会我的事 #

59428次浏览 453人参与

# 牛客AI体验站 #

17466次浏览 297人参与

# 最难的技术面是哪家公司？ #

66163次浏览 982人参与

# 当你面对裁员会如何？ #

366931次浏览 2923人参与

# 一张图晒一下你的AI员工 #

14081次浏览 177人参与

# 职场上哪些行为很加分？ #

327943次浏览 3633人参与

# 找不到实习会影响秋招吗 #

1447169次浏览 13730人参与

# 哪些公司对双非友好 #

208002次浏览 1169人参与

# 找实习是选平台还是选业务？ #

45287次浏览 317人参与

# 面试之前应该如何准备？ #

219450次浏览 2330人参与

# 第一次面试 #

1073178次浏览 13739人参与

# 这份实习，有没有动摇过你的职业方向？ #

1478次浏览 20人参与

# 工作中，努力重要还是选择重要？ #

261869次浏览 2475人参与

# 实习怎么做才有更好的产出 #

32987次浏览 417人参与

# 拿到offer之后，可以做些什么 #

90784次浏览 460人参与

# 如果再来一次，你还会选择这个工作吗？ #

814907次浏览 6421人参与

# 你喜欢工作还是上学 #

90059次浏览 889人参与

# 有必要和同事成为好朋友吗？ #

2037次浏览 37人参与

# 通信/硬件公司求职体验 #

198324次浏览 1055人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务