阿里大模型算法一面 面麻了
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.Agent的架构设计
2.RAG的检索如何实现
3.预训练数据清洗方法
4.Group Query Attention的作用
5.手撕:实现LRU Cache
6.MoE架构的专家路由是对每个token路由还是对每个序列路由
7.KV Cache的优化方法
1.Agent的架构设计
2.RAG的检索如何实现
3.预训练数据清洗方法
4.Group Query Attention的作用
5.手撕:实现LRU Cache
6.MoE架构的专家路由是对每个token路由还是对每个序列路由
7.KV Cache的优化方法
全部评论

感觉没问啥东西啊
相关推荐
点赞 评论 收藏
分享
查看7道真题和解析