美团 复活赛 数据开发 寄录 凉经

10月14号来短信通知约面

10月16号业务初面
面试官介绍部门和业务
(跳过了我的自我介绍,让我直接讲业务)
聊实习经历,业务背景,做了什么
面试官简单问了几个问题
问我知不知道有哪些其他搜索引擎,答不太了解
然后让我自己讲讲实习过程有什么困难的东西
他说不知道要问我什么
简单聊了几个八股
截止此时大概30min
手撕两道sql
1.简单的转置,group by之后case when一下就好了
2.连续日期计算连续时间跟开始结束时间,稍微复习一点,用row_numble进行一个分组,然后group by。
两道sql耗时大概30min。第二道写了的比较久,然后还写错了,我自己进行了一个改正。
反问,问了下技术栈,做实时还是做离线balabala
------------------------------------------
面完两天还没接到二面通知,应该是挂了
他说不知道问我什么,我真有点无语
项目,408,大数据八股那么多东西能问,为啥能问别人,不能拿来问我?两道sql也写出来了,还是寄了。

------------------------------------------
10月21号更新一:已经有人约二面了,还是在我之后一面的。复活赛失败
10月21号更新二:主动联系了hr,得知流程已结束,忘记发感谢信了。已举报面试官

#美团#  #阿里#  #腾讯#  #字节#  #你都收到了哪些公司的感谢信?#  #数据人的面试交流地#  #滴滴#  #京东#
全部评论
佬能看看简历吗,二本小子要进厂哦了
1 回复 分享
发布于 2024-10-21 14:47 重庆
不知道问啥一般是简历问题,简历写的太简或者太详细,或者写的不明不白之类的,面试官找不到切入点,问下去
点赞 回复 分享
发布于 2024-10-23 17:09 山东

相关推荐

搜推+大模型算法一面面试题SFT & RL 方向先 answer 后 cot vs 先 cot 后 answer:两种 SFT 范式在训练效果上有什么差异?你是否做过对比实验?标注质量管控:如何保证人工标注数据的准确率达到预期标准?有哪些校验或质控手段?Checkpoint 选择:如何挑选合适的 SFT checkpoint,用于后续的 RLHF 阶段?多模态输入:图片是如何输入到 VLM 模型中的?一张图片通常会被编码为多少个 token?RL vs SFT:你认为强化学习(RL)和监督微调(SFT)的核心区别是什么?训练范式选择:为什么不直接从零开始做 RL,而是要采用「SFT → RL」的两阶段流程?RL 关键机制:什么是重要性采样?为什么在 RL 训练中要引入 CLIP 机制?策略类型差异:On-policy 和 Off-policy 算法的核心区别是什么?各自的适用场景有哪些?八股文(Transformer 基础)因果掩码作用:Transformer Decoder 中为什么必须使用自回归因果掩码?缩放点积注意力:为什么注意力分数要除以d​k​?(补充:Layernorm 前置后,除以d​可将方差归一到 1,避免 softmax 梯度饱和)推荐系统方向生成式推荐 vs 传统推荐:两者的核心区别是什么?生成式推荐的目标是什么?你如何看待它的未来发展前景?指标计算:AUC、HR、NDCG 的计算公式分别是什么?GAUC 和 AUC 的区别在哪里?编码方式:如何在模型中加入时间编码和位置编码?常用的位置编码方法有哪些?Coding:手撕 Multi-Head Attention(MHA) 实现二面面试题SFT & CoT 细节概率分布特性:在「先 cot 后 answer」的 SFT 范式下,为什么越靠后的 token 概率(prob)会越高?蒸馏噪声处理:用大模型蒸馏得到的 CoT 数据存在大量噪声,该如何缓解?VLM 幻觉问题:对 VLM 做 SFT 时,发现模型更信任文本信息,看图时反而容易产生幻觉,有哪些解决思路?RL 进阶PPO 核心:写出 PPO 中 GAE 的公式,并说明如何递归计算每个 token 的优势函数(advantage)?DPO 损失:写出 DPO 算法的损失函数公式?算法对比:GRPO 和 PPO 的核心区别是什么?GSPO 和 GRPO 又有哪些不同?训练稳定性:你遇到过 RL 中的熵塌缩(entropy collapse)和 reward hacking 问题吗?分别有哪些改进方法?最近有哪些新论文提出了新方案?采样困境:在采样类 RL 算法中,on-policy rollout 无法得到正确答案时该怎么办?自蒸馏:了解 Self-Distillation 吗?为什么要做自蒸馏?最近这方向有哪些代表性论文?震荡优化:RL 训练中 reward 或 loss 震荡严重,该如何调整?(提示:可从学习率 lr、KL 散度约束等方向入手)推荐系统进阶结构对比:HSTU 和 Transformer 结构的差异是什么?它和 OneRec 的整体流程有什么不同?SID 优化:如何降低 SID 碰撞率,同时提高特征利用率?量化算法:RQ-VAE 和 RQ-Kmeans 的算法原理分别是什么?OneRec 工程:OneRec 中是如何将 SID 加入模型词表和 tokenizer 的?多模态融合:如何更好地结合文本特征和多模态特征?模型演进:Rankmixer 是如何发展到 Tokenmixer 的?Coding:给定一个行内严格递增的 m×n 矩阵,找到矩阵中第 k 大的数
面试官最爱问的 AI 问...
点赞 评论 收藏
分享
牛客64354067...:第一题打表,5!以后都是0 第二题贪心,个位数会循环,限制一下循环次数不要一直试 第三题dfs 第四题不会
携程求职进展汇总
点赞 评论 收藏
分享
点赞 评论 收藏
分享
03-21 12:14
山东大学 Java
1.你的登录功能是基于什么来实现的呢?2.你使用了多级缓存,redis+本地缓存,那你的本地缓存是怎么去实现的?3.如果redis和DB库存不一致导致超卖了怎么办?4.如果redis和DB库存不一致,如何让用户感知到下单失败?5.如果抢票只有一张票,但是有上千万和请求到来,如何进行处理?不用消息队列的话?比如令牌桶?限流?6.用redis来实现全局唯一ID是如何来实现的?会不会导致7.项目有做分布式的部署么?如何实现?8.了解什么是Function call,什么是mcp,什么是skill么?9.平时编程有用什么AI么?10.Java面向对象的三大特性是什么呢?有什么含义?11.子类中如何引用父类的方法?12.父类对象的引用可以调用指向子类的新方法么?13.重载和重写有什么不一样么?14.如果重载里面的参数是list,但是泛型不一样,算重载么?15.被哪些修饰修饰的方法是可以重写的?16.Java的static方法有哪些作用?17.有什么办法在静态方法里面调用非静态的方法?18.Java常见的集合或者说集合框架有哪些?19.Concurrenthashmap是如何实现的?20.Java里面有哪些创建线程的方法?21.线程池的有哪些参数?他们具体什么含义?22.为什么要尽量使用自己定义的线程池?23.Thread local的实现是什么?它里面用了什么引用?24.排查过内存泄露的例子么?如何排查内存泄露?25.如何去排查OOM?26.Spring中的autowired和resource注解有什么区别么?27.Spring的bean默认是单例还是多例的?如何创建多例的bean?28.如果依赖注入的时候接口有两个实现,怎么是选择要注入哪个?29.Spring的IOC和DI是什么意思?30.用过spring的切面么?如何使用切面?31.MySQL有哪些隔离级别?他们怎么实现?为什么使用Mvcc解决可重复读?32.MySQL的索引失效的场景有哪些?33.索引是越多越好么?34.为什么平时实际生产要反范式?35.数据库的Join有哪几种方式join啊?有两个表,一张是交易的表,一张是结算的表,交易会每天给把它收到的订单给结算发一份。两个表都有订单号字段,如果有人在结算的表插入订单(不在交易的表)或者交易给结算的表丢失部分数据,如何去排查这些异常的数据?36.计算机网络的tcp协议如何做拥塞控制?37.Tcp头部的内容了解么?有哪些字段?38.手撕:K个一组翻转链表回答了七八成的问题吧,手撕六分钟写出来,面完直接约二面
牛客在线求职答疑中心
点赞 评论 收藏
分享
评论
4
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务