初创小厂算法面经

小厂1:大模型算法偏agent应用(12.11)

说什么和某六小龙有战略合作,所以面试官是某六小龙的
主要是问简历项目
1.训练数据,有没有做数据处理与增强的工作
2.词表怎么训练的
3.量化的结果是什么
4.在什么机器上训练,时间,数据量大小
5.rag中怎么做的pdf解析,对pdf里面的图片,表格数据怎么处理的,怎么编码的,检索,召回的时候都做了哪些操作,混合检索的时候的权重怎么处理的,有没有消融实现对比
6为什么要sft,sft的数据有多少,sft后的效果有没有对比
7.sft与rag对比
8.grpo和dpo对比
9.agent方面有哪些了解
反问,目前在做什么业务
下午面完晚上约二面

某初创公司:大模型算法基座模型(12.12)
1.你导师是谁(绷不住了)
2.有没有考虑过词表的大小对模型表现的影响
3.最影响模型效果的是哪个部分
4.文本编码器用的什么,有没有尝试过更新的方法
5.有没有对模块这部分设计消融实验评估对性能的影响
6讲一下dpo,ppo,grpo的区别
7.介绍了一下他们公司主要做的一个东西,问我对这方面有什么了解
8.一个力扣easy
反问,如果我来会加入到哪个部分

全部评论

相关推荐

1.你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?2.构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离?你是如何保证线程安全的?4.微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。5.DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?6.你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?7.假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?8.多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?9.你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?10.有没有做过工具调用失败后的feedback策略设计?11.训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?12.有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?13.你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?
点赞 评论 收藏
分享
评论
3
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务