吃不饱的芹菜很有担当 level
获赞
5
粉丝
1
关注
1
看过 TA
97
中国地质大学(武汉)
2027
golang
IP属地:湖北
暂未填写个人简介
私信
关注
今天 11:03
已编辑
中国地质大学(武汉) golang
🐜ai infra一面1、面试官人真好啊,自我介绍完我就说我的项目偏业务,看jd上的模型训练、模型推理我都没搞过。他说没事,数据库啊啥的都会涉及到。后面果然一句infra的都没问,哈哈白看了一个周末的infra理论了。2、然后拷问第二个项目。2.1 你这个LangGraph路由是如何设计的,为什么要用它?本质是个状态机,定义了xx状态,实现思路(全局状态、node定义、workflow串起来节点)2.2 源数据是什么?如何做的预处理?论文pdf,向量那一路用的固定长度token+overlap,语义切分那一路按段落切的(回车)2.3 评估是怎么做的?怎么判断切的好不好?其实我没做Recall@k这些,于是扯我做了证据溯源2.4 你用GraphRAG了吗,怎么样,有什么优缺点?用了,优点就是对特定专业领域,比如需要检索一些关键词的隐含关系的场景(科研)上效果好,(面试官补充:源数据准确),缺点就是离线阶段有点耗时,比如二三十篇论文的话差不多二十来分钟,单卡跑的话。(面试官说那已经很快了)3、拷问第一个项目。3.1 为什么做这样一个项目,出发点是什么?我看你部署到vercel了,怎么样?vercel没跑通(尴尬,面试官怎么知道我传到vercel了)3.2 web端还是移动端?以一个用户的角度,进去后可以干嘛?3.3 你这个姿态分析是怎么做的?视频是放在minio里,然后是怎么处理的?我一开始说我调了MediaPipe pose的库做姿态识别,识别到人体关机的三十多个点,然后点点相连成为向量,用cos做相似度分析,最后打分,调llm做个总评。面试官一直在追问这里,说视频具体是如何分析的,有没有什么难点。我有点没听懂,他说他的出发点是觉得调库+向量相似 会有些简陋。唉能不简陋吗,我就开始扯我遇到了两个视频如何对齐的问题,目前的解决方式是设置了个滑杆用户手动调节这个偏差,后期的话可以考虑用音乐来实现。3.4 redis缓存了什么数据?是什么类型的?key和val分别是什么?列表内部的数据究竟是什么?有没有涉及到序列化啥的?唉这块是真尴尬,我只从功能上说了我缓存了用户自己的视频列表和姿态分析的结果。等下快去补补好嘛好的。3.5 如果一个用户上传了个非常大的视频会怎么样,比如几G?我说我做了限流,只可以上传小于500MB的,然后也限制了一个用户一分钟只能执行两次ai分析。他就追问说,如果我现在这个视频就是很大又必须要上传呢?我就说那可以设置个会员功能,付费才能上传大视频。哈哈哈哈面试官笑了一下3.6 MQ为什么用RabbitMQ?我就说RabbitMQ简单,可以满足可靠性。追问可靠性是如何实现的?发送端生产者开启确认机制,存储端设置队列持久化、消息持久化,消费端任务完成之后再ack,还设置了死信队列用来兜底。追问消息进入死信队列会被如何处理?答不上这个。只回答了什么时候会触发死信队列。4、ai 相关。你这个aicoding笔试,我看你问了个“云原生架构是什么”,“会被aicoding取代吗”,真想找个角钻了,原来面试官还能看到我当时的prompt啊,然后他就问我会不会被取代。你是如何看待ai coding的发展的?如何提升aicoding的能力?唉当时顺不好口条,面试官又让我总结了一下我想说啥。5、开放题假如有一个业务需要你用agent实现,如何设计? 需要考虑什么?我问什么场景,他说假设现在有个很厉害的agent来做姿态分析,而不是传统后端这一套了,如何达到生产级别?我说我实在是不懂多模态,如果是文本信息的话,生产级别肯定需要考虑多个用户同时访问的并发压力,比如看有没有一些请求能够合并,或者看这些请求有没有通用/复用的地方,设置个缓存来提高响应速度。面试官问还有啥嘛?then,我大脑空白了几秒钟。憋出来个,或许还可以预训练个模型,搞个舞蹈学习的垂直模型?还有啥需要考虑的,想不出来了。6、反问反问了业务,面试官说了一大串,完全没听懂。反问了agent在业务中如何体现。反问了那您觉得aicoding会取代程序员嘛哈哈哈哈总共50来min,无手撕,好煎熬好漫长的50min。
查看15道真题和解析
0 点赞 评论 收藏
分享
1、自我介绍 2、3min2、面试官介绍部门,说之前的jd有点老了,现在部门主要是做内部的ai提效工具 3min3、我反问说主要是用ai做自动化测试(因为jd里提到很多测试的内容)还是说用ai写代码。面试官说都有4、拷打第一个项目。问我为什么想做一个舞蹈训练平台。他好像对姿态分析那块很好奇,我只说了个大概,用mediapose做姿态识别人体节点,再用向量余弦比较相似度,返回一个实时的相似度分数以及一个最终的评分,再用llm生成一个总结性的建议。面试官感觉我说的不是很清楚,一直问我具体的数据结构,还问我这个实时性是不是真的实时,以及如果出现了一个动作错了会不会导致后面一大串都很错…确实有道理,他是我面这么多场一面第一次这么细致的。我就说我只做了视频一开始的对齐,后面的确实还没考虑到。面试官建议说可以分段做姿态分析。5、拷打第二个项目。他说你这个rag的项目看起来挺简单的(好吧我自己做的时候感觉想法还蛮有创意的嘞),说这个项目是用来做什么的?(他好像很关注项目的实用性)我就扯传统RAG难以解决跨文档检索、可能语义断裂,引出来语义图谱GraphRAG的构建过程,然后还做了溯源,方便查文献blabla你这个路由是怎么设计的?LangGraph的链路是啥样的?6、手撕:第K大的数差点差点忘了怎么建堆,还好最后出来了7、ai场景题:”我这儿有很多不同格式的日志、文档,格式各不相同且分散在各处、中间的解析还可能出现问题,如何通过ai来提取出车速这个字段(车速也有可能命名各不相同)“(唉好抽象完全没听懂又给我讲了一遍,我就先问就抽取这一个字段有必要用到ai嘛哈哈哈哈哈)”我只是假设,也可能要抽取其他字段。“emmmmmmmmm那可能要首先统一一下数据格式,比如都统一成json或者字典”对,然后呢“emmmmmm主包实在想不出怎么回答,就开始套RAG,大概是要分成预处理层、在线问答层、想加的话可以加个评估层,然后ATO循环,直到回答正确。然后说了说RAG每层的大概流程,真没招了,只会扯这些。8、”如果上面的问题用OpenClaw呢,要求在问题可能会有点模糊的情况下也可以返回答案?“(我简直要汗流浃背了,openclaw原来还可以干这个吗)我感觉有点奇怪,就先说我理解的OpenClaw的优势 一个是可以接IM、一个是有强大的本地权限,这个用户他有这么大的权限吗”有的,或者说我设置个权限的弹窗,这个很好解决的“emmm真不知道咋回答了,就硬着头皮说首先肯定要把用户模糊的问题确定化,预先设置一些可能的其他情况,模糊的问题咱不能掌控,可以量化的问题一定得先做好,(在线扶额,实在编不下去了)”这个问题你想的可能比较简单,但现实执行起来还是有点复杂的,涉及到很多人员的问题,比如这个资料你得去找不同的人要啊“(剩下面试官说的没听懂9、反问后续面试流程组里人员情况平时开发用什么ai工具,他们买了企业版copilot,竟然还自研了蔚来的Claw(真开始全员Claw了总共55min,没有八股的面试还挺爽的哈哈哈,就是听不懂面试官的场景题(苦笑)
查看11道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务