面试记录-a

📍面试公司:华海智汇科技
💻面试岗位:大模型应用开发工程师
❓面试问题:

1 Flash-Attention 原理细节描述。online-softmax 与GPU 通信次数。FlashAttention 为什么能做到onepass?
2-RAG 流程。针对上下文多轮对话情况 如何对历史对话进行处理?同时 如何解决LLM 长度限制问题。能否在基座模型的基础上做扩充?
3- Function call / Agent Tools / MCP / A2A 解释名词 原理 对比?
4 最近论文阅读?更倾向算法还是开发工作?

🙌面试感想:
面试官说都挺符合的 但是他们没有坑位 

#面试问题记录#
全部评论
没有手撕 attention 吗
点赞 回复 分享
发布于 2025-06-03 21:52 北京

相关推荐

评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务