岗位:深度学习算法工程师 笔试:9月14日 一面(9月20日) 自我介绍 做什么方向 on-policy和off-policy DQN和PPO 为什么要提出PPO算法 论文为什么用强化学习 手撕代码:超简单,排序解决 反问 组内业务:vivo互联网,主要是应用商店等的推荐 HR面(9月23日) 自我介绍 优缺点 选一面答得不好的问题,重新回答 最大的挑战 最大的成果 实习最大的贡献 倾向城市 家庭情况 offer情况 反问 工作时长:早十晚七 多长时间反馈:最晚十月中旬