HR直接发了两轮面试的链接 第一轮: 介绍自己的项目(我用强化学习PPO、DQN做的小demo) 之前一直都在准备机器学习岗的面试就没有准备强化学习的相关知识,真是一点都想不起来 然后开始问Policy Gradient,了不了解A3C的结构,KL散度怎么计算、DQN的改进方法。。。 看我强化学习的问题都不记得就选择问深度学习= =,但是我还是不会 如何解决过拟合,了不了解BN。。。 后来做了一道算法题 一个二维数组从左到右,从上到下都是增大的 找一个数,又问了时间复杂度 第二轮: 直接问DQN的损失函数, python多线程缺点、了不了解生成器、还有p...