base哪里的😉
点赞 3

相关推荐

08-28 20:20
已编辑
门头沟学院 机器学习
8.28更新,已挂😇😇😇算法方向自我介绍面试官:做过微调吗?讲一下SFT基本原理。我:做过简单的demo,然后稍微说了一下SFT,然后拿 LoRA 举了一下例子。面试官:SFT说完了,讲一下RL经典算法吧。唱了一下 PPO,DPO(DPO有点忘了讲得磕碜巴拉的)面试官:大模型幻觉怎么处理?我(忘了复习了):答 prompt engineer,RAG,rethink,self-consistent。感觉他挺想问我 rethink 怎么优化的,我不知道,只能说多轮询问/换模型交叉验证。面试官:检索算法有哪些?应该是BM25+向量检索那一套的,我脑子抽了说 IVFFat 和 HNSW 。唱了一半面试官赶紧打断我,问我BM25怎么算的,公式说一下。我忘了,就说用词频和逆文档频率(还有个“字段长度归一化”想不起来了)(顺带说一句,问公式诗人???)。面试官:Transformer 结构讲一下。原始论文的架构唱了一会儿,他让我讲一下多头,又唱了一下多头。然后问我为什么 attention score 要除以根号d,我说稳定输出。他让我再从别的角度讲一下,一遍引导一边问我,说可以从分布角度讲。第一遍他说的是“温度”,我脑子蒙了,这怎么扯上温度了。唱了一会儿温度的作用。他赶紧打断我说分布,softmax,又引导了两句,我懵,还是不知道。他说:为了将方差恢复为1,或者说恢复原始方差。我(疯狂道歉+尬笑)面试官:大数据有了解过吗,spark,hadoop 这些。我(不是你真问啊):不知道。面试官:sql了解过吗。我:上学的时候学过一点。问了我一个场景题,想考我 rank 的用法。我完全忘完,直接道歉三连。手撕1.两数之和。脑子抽了两次,一次是key写错了瞪眼5min。第二次是换测试用例忘了换target值,瞪眼2min。最后忙了快10min才写出来。2.很难描述,给定target序列,序列库。求最短的序列库想暴力贪心/回溯,不太行。面试官说换个思路,我说那就dp吧。他说那你dp吧,想了一下时间快到50min了,让我讲一下思路,纠结了一会儿一维还是二维(太紧张了说是,幻视编辑距离)。他反问用的到二维吗?我说一维dp就行,但还是得两层循环,稍微说了一下思路。反问业务都有哪些地方用到大模型,他稍微说了一下。他说你要是到二面了可以问一下二面的业务,他这边是做智能客服的?我内心:6。然后时间也到58min了,我说没问题了,结束。
落贝贝:同学,瞅瞅我司,医疗独角兽,校招刚开,名额有限,先到先得,我的主页最新动态,绿灯直达,免笔试~
查看11道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务