阿里淘天AI开发实习一面 攒攒人品

继续来分享下最近的面经~
1.大模型给出的答案如何与已有的项目结合?
2.联合索引的底层实现?
3.索引使用的数据结构是什么?各种树的特点以及应用场景,如B树、B+树、红黑树等?
4.跳表是什么?原理是什么?
5.实现类似Youtube上亿级别的点赞功能如何实现?如何解决高并发问题?
6.如何存储这些点赞数据?有没有更节省内存的方法?
7.手撕:图论相关的,求有多少个连通分量,每个连通分量里的最长边之和是多少?
全部评论

相关推荐

04-29 12:00
门头沟学院 Java
发一下问题给大家参考,攒攒人品!1. 实习拷打2. 你现在还在实习吗?3. 说一下你实习时候的工作。4. 这几项工作都是你独立做的吗?你主要负责哪一个?5. RAG和传统搜索有什么区别?6. 为什么不直接用关键词检索?7. 举个例子,智能体和大模型怎么交互、协同?工作流程是什么?8. 检索这块你做过效果上的优化吗?9. 有具体的优化案例吗?从效果不好到变好的过程。10. 怎么保证积分可靠性,防止多扣/多增?11. 分布式锁原理大概是什么?12. SETNX 的功能是什么?13. 加锁后进程异常退出,锁泄露怎么办?14. 介绍一下 Spring AI 这个框架。15. 是用 workflow 方式搭建的 agent 吗?16. 用 Spring AI 写一个 agent 的过程大概是什么样的?17. 整个过程完全是大模型自己决策吗?18. 还接触过其他 Agent 开发框架吗?19. 进程和线程有什么区别?20. 线程之间哪些内存是共享的?21. CAS 是什么?22. ThreadLocal 有什么作用?原理是什么,怎么实现线程隔离?23. Kafka 分区的目的是什么?压力具体指什么?24. 实际自己搭建、使用过消息队列吗?25. 为什么选用 RocketMQ,而不是 Kafka?26. 延迟队列是怎么实现的?
查看25道真题和解析
点赞 评论 收藏
分享
一、自我介绍二、项目深度拷问一(多模态相关项目)1. 项目中针对图文模态对齐问题,具体采用了哪些技术方案解决?2. 若图纸类视觉内容在文本中无任何对应描述,模型如何依托视觉特征实现精准内容召回?3. 项目向量数据库Milvus中,选用了哪类索引算法,选择该算法的核心依据是什么?4. 针对专业术语出现语义偏移的问题,除了混合检索方案,是否尝试过Embedding模型微调、Adapter适配等优化方式?具体落地思路是怎样的?三、项目深度拷问二(Agent对话/画像项目)1. 当外部测评工具返回的原始数据格式,与大模型输入预期格式不匹配时,如何实现数据格式的自动化映射?2. 向量库检索出的用户长期画像数据,与当前实时会话状态产生冲突时,整套系统的处理逻辑和解决方案是什么?3. 如何避免模型回复过度依赖检索到的外部知识,导致回答生硬、缺乏共情能力,提升对话自然度?四、AI Agent核心技术原理1. 对比思维链(CoT),ReAct范式在模型与外部环境交互过程中,核心解决了哪些痛点问题?2. 详细阐述大模型实现函数调用(Function Call)的完整流程,模型是如何将自然语言语义转化为标准化结构化参数的?3. 实际开发过程中,如何判断一个任务适合采用固定Workflow流程,还是自主决策型Agent来实现?五、Agent记忆与检索优化1. 详细讲解Agent系统中长短期记忆的设计逻辑,在长时对话场景下,如何实现上下文信息的动态压缩与选择性遗忘?2. 在Agent系统架构中,RAG检索获取的外部知识,是如何精准输入给模型,同时避免无关知识对模型输出产生干扰的?3. 解释重排序(Rerank)技术的定义,它在Agent检索链路中,对提升模型最终决策准确性起到哪些关键作用?六、多Agent与人机协作1. 单Agent处理复杂长周期任务时,引入多智能体(Multi Agent)架构的核心优势有哪些?2. Multi Agent系统中的路由(Router)节点,依据哪些规则和逻辑,将任务分发给对应的子Agent?3. 什么是人在回路(Human-in-the-loop)机制?在Agent系统开发中,如何合理设计人工审批断点,保障系统运行可靠性?七、系统评估与性能优化1. 有哪些量化评估方式,可以衡量一套Agent系统的优劣?2. 除模型生成质量外,Agent系统还需要重点关注哪些维度的评估指标?3. 针对Agent多步推理过程中产生的响应延迟问题,可落地的优化方法有哪些?4. 随着大模型上下文窗口持续扩容,传统RAG技术是否会被完全替代?阐述你的核心观点及理由。
查看20道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务