学校研究方向、论文、性能优化这个项目是自己练习做的,没有实际在实际场景中应用的是吧?在性能方面做了哪些优化,具体提升了多少?Rag 和 ReAct 怎么用的这个知识库包含的数据量级大概是多少?如何将这些文档拆分成块并构建知识库?区分后的案例是否会从知识库中移除?在使用知识库时,如何平衡原理和案例信息的比重?向量数据库是如何高效检索到用户想要的结果的?哈希表的底层实现大致是什么样的?哈希表的初始容量如何设置?怎么调整哈希表在什么情况下会发生频繁冲突?如何优化哈希表以避免频繁冲突?在扩容时,如何决定扩容多少?在内存分配上,栈和堆哪个分配更快?栈上分配更快的原因是什么?在处理大规模数据集(几十亿至上百亿)时,如何高效地找出其中最大的 N 个数?(单调队列,面试官引导下说了说思路对于 OOM 内存溢出问题,排查 and 解决的步骤是什么?