算法打工人 level
获赞
26
粉丝
23
关注
0
看过 TA
200
中山大学
2026
算法工程师
IP属地:山东
咨询辅导:请联系牛客账号 算法打工人阿旺
私信
关注
一、自我介绍二、项目深度拷问一(多模态相关项目)1. 项目中针对图文模态对齐问题,具体采用了哪些技术方案解决?2. 若图纸类视觉内容在文本中无任何对应描述,模型如何依托视觉特征实现精准内容召回?3. 项目向量数据库Milvus中,选用了哪类索引算法,选择该算法的核心依据是什么?4. 针对专业术语出现语义偏移的问题,除了混合检索方案,是否尝试过Embedding模型微调、Adapter适配等优化方式?具体落地思路是怎样的?三、项目深度拷问二(Agent对话/画像项目)1. 当外部测评工具返回的原始数据格式,与大模型输入预期格式不匹配时,如何实现数据格式的自动化映射?2. 向量库检索出的用户长期画像数据,与当前实时会话状态产生冲突时,整套系统的处理逻辑和解决方案是什么?3. 如何避免模型回复过度依赖检索到的外部知识,导致回答生硬、缺乏共情能力,提升对话自然度?四、AI Agent核心技术原理1. 对比思维链(CoT),ReAct范式在模型与外部环境交互过程中,核心解决了哪些痛点问题?2. 详细阐述大模型实现函数调用(Function Call)的完整流程,模型是如何将自然语言语义转化为标准化结构化参数的?3. 实际开发过程中,如何判断一个任务适合采用固定Workflow流程,还是自主决策型Agent来实现?五、Agent记忆与检索优化1. 详细讲解Agent系统中长短期记忆的设计逻辑,在长时对话场景下,如何实现上下文信息的动态压缩与选择性遗忘?2. 在Agent系统架构中,RAG检索获取的外部知识,是如何精准输入给模型,同时避免无关知识对模型输出产生干扰的?3. 解释重排序(Rerank)技术的定义,它在Agent检索链路中,对提升模型最终决策准确性起到哪些关键作用?六、多Agent与人机协作1. 单Agent处理复杂长周期任务时,引入多智能体(Multi Agent)架构的核心优势有哪些?2. Multi Agent系统中的路由(Router)节点,依据哪些规则和逻辑,将任务分发给对应的子Agent?3. 什么是人在回路(Human-in-the-loop)机制?在Agent系统开发中,如何合理设计人工审批断点,保障系统运行可靠性?七、系统评估与性能优化1. 有哪些量化评估方式,可以衡量一套Agent系统的优劣?2. 除模型生成质量外,Agent系统还需要重点关注哪些维度的评估指标?3. 针对Agent多步推理过程中产生的响应延迟问题,可落地的优化方法有哪些?4. 随着大模型上下文窗口持续扩容,传统RAG技术是否会被完全替代?阐述你的核心观点及理由。
查看20道真题和解析
0 点赞 评论 收藏
分享
1.请做一段简单的自我介绍。2.做多模态Embedding任务时,如何平衡文本语义与图像视觉特征的相似度计算权重,若用户检索图纸特定参数却召回大量外观相似零件图,问题根源是什么,同时Ragas指标中Context Precision过低该如何优化?3.你的向量记忆库采用何种去重方案,用户重复表述同一内容时会重复存储还是语义合并,基于MCP接入多测评工具且同问题返回格式不统一时该如何处理?4.面对用户模糊含糊的提问,Agent会直接检索知识库还是先反问用户确认需求?5.当Agent调用工具出现报错时,该怎样设计提示词引导模型利用报错信息自主重试,而非直接将错误返回给用户?6.长对话上下文处理中,除文本截断外,请列举并说明多种更高效的上下文压缩方案。7.多Agent系统中,依靠LLM充当路由分发任务与依靠固定规则分发任务,二者分别具备哪些优势与劣势?8.基于Milvus数据库,如何完成BM25检索与向量检索的分数归一对齐操作?9.需要限定检索某一时间节点之后的数据时,向量数据库该如何高效实现标量条件过滤?10.是否了解LoRA微调技术,训练LoRA过程中两个核心参数矩阵分别采用怎样的初始化方式?11.请详细阐述QLoRA算法的核心设计思想与关键原理。12.针对逻辑推理类任务做LoRA微调,对比普通对话任务,LoRA秩的取值应该偏大还是偏小并说明原因?13.模型推理部署阶段,为消除LoRA分支带来的推理额外延迟,是否会执行权重Merge操作?14.垂直领域指令微调后模型通用能力出现退化下降,有哪些可行的解决与改善办法?16.对比PPO算法,DPO训练无需在线采样生成回答的核心原因是什么,标准DPO训练的数据格式包含哪些内容?17.高并发场景下同时调用10个不同Embedding接口,asyncio.gather相较于多线程方案在系统资源消耗层面具备哪些具体优势?18.请手写代码实现合并K个升序链表的算法题解法。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看17道真题和解析
0 点赞 评论 收藏
分享
2025-09-09 23:45
中山大学 算法工程师
1️⃣优化出发点推荐系统的发展始终围绕一个核心问题:如何精准理解用户偏好并匹配最相关的内容。✅冷启动困境:新加入系统的物品由于缺乏历史交互数据,其ID嵌入往往难以准确学习,导致推荐效果差。这与NLP中的未登录词(OOV)问题类似,严重限制了系统对新物品的推荐能力。✅泛化性不足:ID token难以捕捉相似物品间的共享特征,每个物品都被视为完全独立的实体,忽视了它们之间可能存在的语义关联。2️⃣模型架构:双token统一与距离度量创新的完美融合统一表征学习框架是一个精心设计的系统,主要由三个创新组件构成:统一的语义与ID tokenization策略、融合余弦相似度与欧氏距离的度量方法,以及端到端的联合优化机制。✅统一语义与ID tokenization:框架的核心思想是保留ID token的必要维度来表征物品独特属性,同时用语义token替代冗余维度来捕捉共享特征。✅统一距离度量:解耦与区分的层次化策略,论文的另一个关键贡献是对不同相似度度量在推荐系统中作用的深入分析。端到端联合优化:三重损失协同训练    为确保各组件协调工作,框架采用端到端训练方式,同时优化三个关键目标:推荐损失;RQ-VAE量化损失;文本重建损失。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享
2025-09-07 22:40
中山大学 算法工程师
查看14道真题和解析
0 点赞 评论 收藏
分享
2025-09-05 23:02
中山大学 算法工程师
1️⃣一面 1.自我介绍2.介绍一下项目,遇到的难点和解决的问题3.介绍Transformer,编码器和解码器的注意力有什么区别4.了解CLIP吗 ,介绍一下其他的对比学习方法5.说一下R1的训练过程6.BLIP 的三个损失函数分别是什么,数据是怎样清洗的7.BLIP2相对于 BLIP 有哪些改进,BLIP3又有哪些改进8.视觉编码器和 LLM 连接时,使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好,说说各自的优缺点9.代码:买卖股票最佳时机2️⃣二面1.自我介绍和过项目2.Qwen- VL 的三个训练流程分别是什么,有什么作用介绍一下 CLIP3.后来有哪些比较经典的基于 Transformer 的语言模型, Qwen 相比于原始 Transformer 有哪些结构上的改动4.了解 RLHF 吗, DPO 和 PPO 有什么区别, Loss 是什么样的,各自的优缺点是什么5.了解哪些多模态大模型,简要介绍几个6.了解 LoRA 吗, LoRA 微调的原理是什么7.对PPO DPO GRPO计算逻辑的理解8.代码:实现多头自注意力3️⃣三面1.自我介绍和实习经历介绍2.GNN与LLM结合理解3.场景题:涉及偏好对话模型4.反问:岗位职责和未来规划📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看21道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务