美团大模型算法 日常实习 一面
欢迎友好讨论,信息共享
1.实习拷打
2.做 grpo 遇到熵崩没有?你是怎么理解的?
3.大模型容易 reward hacking,如何解决?
4.VLLM prefix cache实现过吗?
5.如何理解 dspo 这几个算法的创新?
6.长上下文压缩有哪些方法?
7.MOE 的 expert parallel 如何做的?
8.手撕: transformers encoder
1.实习拷打
2.做 grpo 遇到熵崩没有?你是怎么理解的?
3.大模型容易 reward hacking,如何解决?
4.VLLM prefix cache实现过吗?
5.如何理解 dspo 这几个算法的创新?
6.长上下文压缩有哪些方法?
7.MOE 的 expert parallel 如何做的?
8.手撕: transformers encoder
全部评论
相关推荐
鳕鱼堡ouo:别去。。。除了你的+2和hr其他人都不知道你的工资。也就是说你拿着最低的工资干着和别人一样的活承受着和别人一样的压力,同事半夜拉会也一样会拉你,辛苦和钱多至少得占一样吧,劝退价的话真没必要了
点赞 评论 收藏
分享
查看11道真题和解析