攒人品中,祝大家都能拿到满意的Offer!1.记忆系统中的意图识别是做什么的。2.为什么embedding选择1024维度,而不是更高或更低。3.Qwen4Bembedding是如何实现的,模型框架是什么,是否属于BERT系列。4.Qwen34Brerank是如何实现的。5.注意力机制(Attention)如何实现。6.Q、K、V矩阵是如何得到的。7.Attention中除以dk的作用。8.如果不除以dk,有没有替代方式。9.多头注意力(Multi-HeadAttention)解释一下。10.多头注意力存在什么问题。11.如何解决多头注意力计算开销过大的问题。12.RoPE是什么,RoPE解决了什么问题。13.memory系统中,如果文本过长如何处理。14.摘要总结会丢失细节,如何解决。15.不同agent之间的记忆如何共享。16.一个agent除了记忆模块还应该包含哪些