字节大模型算法岗面经简略版
1.项目介绍
2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?
3.RAG 和 GraphRAG 在处理多跳推理时的根本?
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码?
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题:最长连续递增子序列(LeetCode 674)
2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?
3.RAG 和 GraphRAG 在处理多跳推理时的根本?
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码?
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题:最长连续递增子序列(LeetCode 674)
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
nlhxq🌱:就这样的就业形势,这些畜牲学校领导还卡着不让去实习。人家秋招你实习,人家入职你打灰 点赞 评论 收藏
分享
查看2道真题和解析