笔试a 1.83(没开long long不ac的那次)(投的好迟现在才面第一家)1.自我介绍2.实习拷打-agent具体流程-使用什么模型,时延多少-复合多少tool,缺槽具体是怎么处理的-多轮逻辑有吗-RAG怎么做的-记忆怎么更新,删除。权重3.kv cache了解吗,具体是啥,存kv,为啥不存q4.回到实习,kv cache下,你的query怎么构建,顺序如何才能利用好5.即使把query放最后,如果新增小变更 前面的k矩阵还是会变化要重算,怎么办。-乱答flashattention,被指出错误,问是否了解vllm里的解决机制-不是搞infra的,论文也是可解释性相关的,没追问了6.做题top k大的元素,k<<N;-上午面脑子不清醒,一开始写了个堆排序,随后立刻改成k大小的堆排序7.问想来做什么8.反问40min猛攻特勤处,洗洗睡了