美团大模型算法 日常实习 一面

欢迎友好讨论,信息共享
1.实习拷打
2.做 grpo 遇到熵崩没有?你是怎么理解的?
3.大模型容易 reward hacking,如何解决?
4.VLLM prefix cache实现过吗?
5.如何理解 dspo 这几个算法的创新?
6.长上下文压缩有哪些方法?
7.MOE 的 expert parallel 如何做的?
8.手撕: transformers encoder
全部评论

相关推荐

03-17 19:33
已编辑
门头沟学院 Java
鳕鱼堡ouo:别去。。。除了你的+2和hr其他人都不知道你的工资。也就是说你拿着最低的工资干着和别人一样的活承受着和别人一样的压力,同事半夜拉会也一样会拉你,辛苦和钱多至少得占一样吧,劝退价的话真没必要了
点赞 评论 收藏
分享
03-17 23:54
黑龙江大学 Java
来个白菜也好啊qaq:可以的,大厂有的缺打手
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务