某新能源汽车厂商agent大数据面试

#发面经攒人品#

一、实习经历深挖

1. 介绍mass团队的实习经历,展开说明数据清洗工作的具体内容。

2. 实习中,知识库数据是进入数仓还是直接供大模型做智能问答?

二、项目相关问题

1. 智能检索问答系统项目是参与还是主要负责?

2. 该项目的核心需求、技术栈(FastAPI、Scikit-Learn、Langchain等)及实现逻辑。

3. 项目中使用了哪些Embedding模型?

4. 向量数据库创建后是否对外提供服务?下游如何使用这些服务?

5. 如何设计论文数据的处理流程,如何更新向量数据库中的数据?

6. 项目中如何创建索引?根据业务场景选择索引类型的逻辑。

三、技术能力考察

1. 是否接触过结构化数据和数据仓库?

2. 用SQL查询月累计销量(需实现按月累加统计)的方法。

3. 是否接触过SQL窗口函数?

4. 了解数仓ODS层到ADS层的层级关系及简称吗?

5. 是否有结构化数据库处理、数仓搭建相关经验?

四、岗位适配与求职意向

1. 对知识图谱的熟悉程度。

2. 有什么想了解的关于公司业务线的问题?
全部评论
数据仓库和mysql是关键
点赞 回复 分享
发布于 05-14 16:04 江苏

相关推荐

1. 你对Graph和DAG框架有什么理解?2. 有向无环图(DAG)与含循环图(如循环RAG)的区别是什么?3. 有向无环图(DAG)适合什么场景?含循环图(如循环RAG)适合什么场景?4. 针对“每日自动分析并编排工作计划”的需求,该如何设计架构?是否需要结合循环RAG架构与短期记忆机制?5. 对于“每日自动分析并编排工作计划”的需求,应将能力沉淀为Skill还是长期记忆以实现持久化?6. Multi-Agent编排中,可能会出现死循环或Agent间推诿的问题,该如何监控与规避?7. 长流程中大模型输出被截断(如代码/文档不完整),有哪些工程化的解决手段?8. 从Prompt层面,如何解决大模型输出被截断的问题?(如few-shot示例、自校验机制)9. 从代码层面,如何解决大模型输出被截断的问题?(如重试逻辑、后处理清洗)10. MCP与Skill的区别是什么?11. 怎么设计一个大模型网关系统?12. 大模型未来在Skill能力上的发展趋势是什么?13. 请说说你的项目参赛经历,以及你在团队中担任的角色(如小队长)和具体负责的工作?14. 你是否考虑将参与的项目转化为创业方向?15. 你的毕业时间是什么时候?16. 你目前的状态是什么?(如全职实习)17. 大四是否还有课程?后续返校需要完成哪些事宜?
查看17道真题和解析
点赞 评论 收藏
分享
评论
2
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务