阿里大模型算法一面 面麻了

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.Agent的架构设计
2.RAG的检索如何实现
3.预训练数据清洗方法
4.Group Query Attention的作用
5.手撕:实现LRU Cache
6.MoE架构的专家路由是对每个token路由还是对每个序列路由
7.KV Cache的优化方法
全部评论
大模型算法还问LRU啊
点赞 回复 分享
发布于 03-24 18:01 黑龙江
感觉没问啥东西啊
点赞 回复 分享
发布于 03-19 23:27 北京

相关推荐

不愿透露姓名的神秘牛友
03-26 09:27
字节 算法 38x15,两位数签字费 硕士985
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务