字节三面
1. bpe讲一下(不会)
2. ppo讲一下,dpo讲一下(怎么都爱问这个)
3. rl,基于值函数和策略,异同,哪个好
4. 拷打项目,不复杂的任务为什么要用llm(当然是追热点)
5. 状态,动作讲一下概念
6. rag的embedding用的什么,怎么优化,召回性能,精排性能
7. 幻觉怎么解决
8. 拷打实习
手撕数组topk
感觉字节很喜欢拷打强化学习和embedding,二面三面都围绕这两个问
2. ppo讲一下,dpo讲一下(怎么都爱问这个)
3. rl,基于值函数和策略,异同,哪个好
4. 拷打项目,不复杂的任务为什么要用llm(当然是追热点)
5. 状态,动作讲一下概念
6. rag的embedding用的什么,怎么优化,召回性能,精排性能
7. 幻觉怎么解决
8. 拷打实习
手撕数组topk
感觉字节很喜欢拷打强化学习和embedding,二面三面都围绕这两个问
全部评论
好难
大佬

大模型对数字token化以后,分布不表达大小关系,不敏感,如何解决数字比大小的问题

场景题,如果想做一个大模型,从预训练到微调到rag,都应该怎么做

强化学习和 embedding 是因为大佬简历有吗,问的也太多了。。。。问我直接死给他看
佬是电商的吗
佬 原来字节还有提前批呀

我去佬都三面了,这提前批是怎么投的呢,具体什么岗啊

许愿后续流程
相关推荐