快手实习 大模型算法面经 攒人品

发点面经攒攒人品~
1.项目拷打
2.实习拷打
业务背景
用的是什么模型
数据是如何获取和构造的(清洗去重过滤)
SFT阶段有哪些badcase又是怎么解决的?
为什么要用R?
GRPO的奖励函数是如何设计的?最终的结果是什么?
3.项目:你的agent是如何实现上下文压缩和记忆管理的?多个agent之间是如何进行通信的?
4.场景题:如果我们这边的agent对于用户意图识别不准确,在工程上有哪些方法进行优化。
5.算法题:面积最大的正方形,返回其左上角位置
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务