深圳虾皮信息科技有限公司

收藏
互联网
1000-9999人
未融资
深圳市
live 正在进行专场招聘活动,简历直投企业HR, 前往投递
福利丰厚榜HC充足榜WLB/965榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
测试
数据
人工智能/算法
更多
最新
热门
独角兽内推__免笔试:同学,瞅瞅我司,医疗独角兽,校招刚开,名额有限,先到先得,我的主页最新动态,绿灯直达,免笔试~
查看12道真题和解析
点赞 评论 收藏
分享
昨天 20:20
已编辑
门头沟学院 机器学习
8.28更新,已挂😇😇😇算法方向自我介绍面试官:做过微调吗?讲一下SFT基本原理。我:做过简单的demo,然后稍微说了一下SFT,然后拿 LoRA 举了一下例子。面试官:SFT说完了,讲一下RL经典算法吧。唱了一下 PPO,DPO(DPO有点忘了讲得磕碜巴拉的)面试官:大模型幻觉怎么处理?我(忘了复习了):答 prompt engineer,RAG,rethink,self-consistent。感觉他挺想问我 rethink 怎么优化的,我不知道,只能说多轮询问/换模型交叉验证。面试官:检索算法有哪些?应该是BM25+向量检索那一套的,我脑子抽了说 IVFFat 和 HNSW 。唱了一半面试官赶紧打断我,问我BM25怎么算的,公式说一下。我忘了,就说用词频和逆文档频率(还有个“字段长度归一化”想不起来了)(顺带说一句,问公式诗人???)。面试官:Transformer 结构讲一下。原始论文的架构唱了一会儿,他让我讲一下多头,又唱了一下多头。然后问我为什么 attention score 要除以根号d,我说稳定输出。他让我再从别的角度讲一下,一遍引导一边问我,说可以从分布角度讲。第一遍他说的是“温度”,我脑子蒙了,这怎么扯上温度了。唱了一会儿温度的作用。他赶紧打断我说分布,softmax,又引导了两句,我懵,还是不知道。他说:为了将方差恢复为1,或者说恢复原始方差。我(疯狂道歉+尬笑)面试官:大数据有了解过吗,spark,hadoop 这些。我(不是你真问啊):不知道。面试官:sql了解过吗。我:上学的时候学过一点。问了我一个场景题,想考我 rank 的用法。我完全忘完,直接道歉三连。手撕1.两数之和。脑子抽了两次,一次是key写错了瞪眼5min。第二次是换测试用例忘了换target值,瞪眼2min。最后忙了快10min才写出来。2.很难描述,给定target序列,序列库。求最短的序列库想暴力贪心/回溯,不太行。面试官说换个思路,我说那就dp吧。他说那你dp吧,想了一下时间快到50min了,让我讲一下思路,纠结了一会儿一维还是二维(太紧张了说是,幻视编辑距离)。他反问用的到二维吗?我说一维dp就行,但还是得两层循环,稍微说了一下思路。反问业务都有哪些地方用到大模型,他稍微说了一下。他说你要是到二面了可以问一下二面的业务,他这边是做智能客服的?我内心:6。然后时间也到58min了,我说没问题了,结束。
查看11道真题和解析
点赞 评论 收藏
分享
08-25 12:04
已编辑
蚌埠坦克学院 C++
自我介绍 实习部分深挖鸡架实习,期间狠狠挖坑,但是答错了也会说正确解决方案,也是狠狠学习了本来说只聊一段实习的,但可能觉得这个鸡架太简单了了,又简要讲了一下 web 后端实习InnoDB 下不是要求必须有主键吗?为什么有主键索引,还需要去建额外的索引,才能保证查询效率?应该是想问 SQL 语句的 WHERE 部分查询条件是不是主键索引为什么要用 Redis 分布式锁来限制用户的创作任务,为什么不直接在 MySQL 里面加一个字段?后期会添加服务器数量,便于水平扩展语言部分熟悉什么语言?C++那太好了,我们这里主要也用 C++,当然 Golang、C++、Rust 都 OK菱形继承?什么是二义性?能否强制指定避免二义性?(不会)什么是切片现象?带有虚函数的对象,其内存模型是什么样的?emplace_back 和 push_back 的区别?emplace_back 的实现用到了 C++ 什么特性?网络部分1s 内 100W 个 TCP 连接请求打到服务端,会发生什么?(其实就是考半连接状态的负面影响)数据库部分哪些隔离级别,各自有哪些异常操作系统部分malloc 分配 1GB 内存时,还未进行其他任何操作,前后的 top 命令有什么变化?应该是问内存分配的原理,答虚拟内存多 1GB,物理内存几乎不变什么时候发生缺页中断?答只知道 Redis 持久化中做后台重写时会发生,就跳过这个问题了算法部分一开始让用 Golang 实现两个协程交替打印 0~n 的数,一个打印奇数,一个打印偶数,保证最终打印的顺序还是 0、1、2、3 ... 这种顺序这题应该很简单了,但是 Golang 只会 CRUD,让自己写真不会说自己不是很熟悉 Golang 之后,就换成了带过期时间的 LRU,虾皮这个面试站的编辑器真的难用,很多代码不全都没有,硬是手敲了二十多分钟,然后运行之后我这里还看不到输出,只能让面试官遥控 debug,最后这道算法写了快 40min,也是很难绷了反问基础架构部门,系统的稳定性肯定很重要,设计之初会怎么来考虑?答:问题太大了,回答不了基于面试表现的建议答:没啥建议,知识面挺广的,算法环节再加强一下总共几轮技术面答:2~3轮,具体问 HR最后就是经典的感谢您的时间总结从 11:30 面到 13:00,两个人都很耐饿了鸡架应该还是很看代码实操的,算法题发挥太差,大概率 G,但学到东西了,还是挺不错的更新没想到面完美团就约 8.30 二面了,又是同样的周六,又是同样的 11:30 开始,难绷
查看25道真题和解析
点赞 评论 收藏
分享
📍面试公司:虾皮🕐面试时间:2025-08-24💻面试岗位:虾皮- AI训/推框架算法工程师❓面试问题:如下🙌面试感想:面试官很好,秋招以来遇到过最好的。BG:末9本,中科院硕,和组内课题不相关自我介绍:一分钟完事## 1.讲讲FlashAttention机制## 2.讲讲PageAttention机制## 3.既然提到了操作系统虚拟内存,那讲讲操作系统中页表的结构,页面是否是连续存储的?## 4.讲讲PPO核心原理## 5.PPO中有个重要性采样是什么?写一下PPO的损失函数?为什么需要重要性采样?## 6.深度剖析PPO中每个模型的作用是什么## 7.为什么需要KL散度## 8.奖励模型时怎么训练的,既然有了奖励模型打分,那为什么还需要价值模型,价值模型的作用是什么?奖励模型和价值模型是怎么训练的?## 9.GRPO在此基础上有什么优化?## 10.讲一讲连续批处理技术是什么,为什么需要连续批处理技术?## 11.为什么需要PD分离?## 12.集合通信原语有哪些?## 13.Python中的Dict是什么,如何解决哈希冲突的问题?有哪些解决方案,有没有可能降到O(1)## 14.你这个RAG项目是如何进行Embedding的,用的什么向量检索工具,Fassi的原理是什么?## 15.跑过PPO训练吗?## 16.分布式并行策略有哪些?## 17.TP并行张量是如何切分的,又是如何合并的,按行切和按列切有何不同?## 18.PP并行的缺陷是什么?如何解决气泡问题?你能写出计算气泡大小的公式吗?## 19.有没有了解过分布式训练?## 20.你用过哪些显卡,他们的动态指标有哪些?有用过什么工具去监测吗?🍣手撕:Hot100.数组中只出现过一次的数,其他元素都只出现过两次变形:其他元素都出现过三次呢?反问:您觉得我掌握的怎么样,我自认为觉得还有点距离需要沉淀;面试官评价理论还可以,实操太少。确实中肯,虚心接受,挂了也心服口服。
查看20道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务