减肥口号喊得比谁都响 level
获赞
11
粉丝
3
关注
0
看过 TA
107
门头沟学院
2026
推荐算法
IP属地:北京
暂未填写个人简介
私信
关注
整体面试还是不错的,但是没后续了,不知道是哪里出了问题项目1. 简单介绍一下这个系统的知识库问答架构,从文档入库到最后回答的完整链路是怎样的?2. 向量检索用的是什么索引类型?3. 在召回之后有没有做重排(Rerank)之类的操作?4. 你知识库的准确率和召回率是怎么评估的?5. Spring AI Alibaba 的 Function Calling 是怎么实现的?模型如何决定调用哪个工具?6. 如果工具调用失败了,你们设计了什么处理机制?7. Execute Plan 模式具体是怎么实现的?8. 平时哪种模型用的比较多?9. 平时编码时会用哪些模型?10. 在选择向量数据库时,有没有看过其他的(如 ES、Milvus 以外的选择)?它们之间的区别你大概有概念吗?11. 在写 Prompt的时候,你有哪些实践经验或设计原则?12. Graph Rag / Agentic Rag了解过吗13. 在秒杀下单中,Lua 脚本具体做了什么?为什么要用 Lua,而不是分开执行多条指令?14. 这个项目你自己做过压测吗?15. 对系统能扛住的流量(QPS)有没有具体的概念?16. 对于什么时候该上缓存、什么时候该上本地缓存,你大概的概念是什么Java 基础1. 线程池的核心参数有哪些?2. 线程池内部的具体工作流程是怎样的?3. 核心线程数和最大线程数一般怎么确定/计算?场景题1. 你觉得目前 RAG(检索增强生成)最大的瓶颈是什么?2. 假设要给电商平台搭建一个百万/千万级的商品知识库问答系统,你会怎么设计?3. 针对商品信息(如价格、描述)可能被商家动态更新的情况,你的知识库设计需要考虑什么?手撕:二叉树的层序遍历
查看23道真题和解析
0 点赞 评论 收藏
分享
被横向挂了,希望发出来对大家有帮助!1* 简单概述你简历中的两个项目,包括项目背景以及你的具体分工,是独立完成还是团队协作2* 项目的数据来源是什么?你是如何确定优化目标的?3* 比如数据从 100 条扩充到 1.2 万条,是否全通过自动化生成?生成的样本具体是什么样的?举个例子说明一下生成前后的对比4* 怎么保证自动化生成数据的正确性呢5* 在通过调整参数直到模型回答正确为止的过程中,是否意味着生成的CoT中存在错误逻辑?6* 经过数据清洗后,最终用于SFT的有效数据量是多少?7* 在做微调时,除了 LoRA 是否对比过其他的微调算法8* 你是如何评价微调效果的?测试集的比例是多少?微调前后的准确率分别是多少?原有的模型性能保留了多少?9* LLM常用的结构是什么?10* 说一下Transformer 的整体结构11* 目前主流大模型最常用的位置编码是什么?。12* 写一下多头注意力机制的数学公式。13* 公式中为什么要除以 \sqrt{d_k}?其对梯度消失或梯度爆炸有什么影响?14* 在 Transformer 的 Encoder 和 Decoder 中,哪些部分是可以并行计算的,哪些不可以?15* 除了 LoRA,你还了解哪些微调方法?16* 大模型训练通常使用什么损失函数17* 在机器学习基础中,二分类问题、多分类问题以及回归问题分别使用什么损失函数?18* 你了解哪些优化算法19* 模型训练中出现过拟合的常用解决方案有哪些?20* Dropout 在训练阶段和预测阶段的处理方式是否一致?为什么要这样做?21* 大模型中的“复读机问题重复生成是什么原因导致的?如何从解码策略或训练层面解决?22* 幻觉问题产生的原因是什么?目前常用的工程解决方案有哪些?23* 写出逻辑回归的数学公式。
0 点赞 评论 收藏
分享
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务