百度 强化学习算法二面 攒人品
#开放七大实习专项,百度暑期实习值得冲吗# 被横向挂了,希望发出来对大家有帮助!
拷打实习
1.特征重要性筛选,除了做shuffle还有哪些方法?单个特征的shuffle对其他特征的交叉影响该如何考虑?
2.介绍一下SENet
3.多任务模型中,针对单个目标头,可以如何优化?
4.如何解决MoE中的专家退化问题?
5.强化学习落地,如何从离线强化学习切换到在线强化学习?
6.奖励函数中的多目标权重如何设置?
手撕:
1.多臂老虎机:给你k个按钮,每个按钮会返回一个奖励,该奖励服从正态分布,每个按钮奖励的正态分布参数不同,请返回奖励期望最大的那个按钮
2.给定一个函数F(x),实现任意机器学习算法拟合这个函数
拷打实习
1.特征重要性筛选,除了做shuffle还有哪些方法?单个特征的shuffle对其他特征的交叉影响该如何考虑?
2.介绍一下SENet
3.多任务模型中,针对单个目标头,可以如何优化?
4.如何解决MoE中的专家退化问题?
5.强化学习落地,如何从离线强化学习切换到在线强化学习?
6.奖励函数中的多目标权重如何设置?
手撕:
1.多臂老虎机:给你k个按钮,每个按钮会返回一个奖励,该奖励服从正态分布,每个按钮奖励的正态分布参数不同,请返回奖励期望最大的那个按钮
2.给定一个函数F(x),实现任意机器学习算法拟合这个函数
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
相关推荐
查看17道真题和解析 点赞 评论 收藏
分享
