字节搜推算法一面 被拷打麻了

给我面没招了,发点面经攒攒人品~
1.项目拷打
2.样本如果都不一致了,降噪剔除后的离线 AUC 到底是怎么算出来的?
3.讲讲长短序列建模的落地方案?
4.做 SIM 过滤时,类目到底是用 Target 还是用户预估的?
5.你们重排只用了 MMR 吗?有没有试过更复杂的方法?
6.怎么衡量 MMR 的相似度?为什么不用 BERT 这种纯语义模型去提 Embedding?
7.打散通常会提升多样性体验,但你们测试下来人均 IPV(点击量)反而降了,怎么解释这种现象?
8.详解 Transformer 里的 Multi-head Attention 机制?为什么要用多头?
9.训练时发生梯度消失或者梯度爆炸,怎么排查?怎么解决?
10.详细对比 Batch Norm 和 Layer Norm?(LN 主要是特征维度归一化,Transformer 必考,我这里答得有点磕巴,大家一定要记牢)
11.做完全均匀的随机负采样,对整体 AUC 的期望会有影响吗?为什么?
12.了解大模型的 Scaling Law(缩放定律)吗?

最后两道手撕:

最大子数组和(LC 53)
无重复数组的全排列(LC 46)
全部评论

相关推荐

04-21 12:38
已编辑
门头沟学院 Java
自我介绍和实习省略,实习问了两个相关的,部分八股,无深挖大概20min,手撕了20minQ4:你在项目中使用了Redis Zset,它是用来做什么的?A4:用于实现的定时发布功能。使用score存储时间戳,按时间戳排序。通过Spring Task定时任务每秒扫描,查询当前时间戳范围内的帖子并修改状态为已发布。考虑过使用消息队列,但因实际QPS较低选择了Redis Zset。Q5:Zset的数据结构是怎样的?A5:由跳表和哈希表实现。哈希表用于O(1)时间复杂度查询key对应的score。跳表是多级索引结构,类似B+树但更灵活。叶子节点是单链表,按顺序串联。索引节点随机分布,没有严格的树高要求。Q6:B+树是什么?为什么使用它?A6:是多叉树,MySQL InnoDB引擎的默认存储结构。主要解决索引和排序问题。相比哈希表,B+树能维护有序性。节点大小通常为16KB页,减少IO次数。目标是构建宽矮的树,减少访问节点数。Q7:请解决一道编程题(股票买卖问题)A7:初始问题:一次买卖,用last维护前i-1天的最低价格,计算最大收益。变种问题:必须完成两次买卖,不能当天买卖。Q8:你有什么问题想问我们?A8:询问部门具体业务:生活服务营销部门,做抖音生活服务业务的营销相关。技术方向:传统Java后端和智能体都有。面试结果反馈时间:预计几天内。感觉面试官也不太感兴趣,仅做记录无参考价值。
查看5道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务