近期面经总结

最近比较忙，面试也没停，不记得太多了，写一些我觉得比较有意思的。来源淘天度小满快手字节等
1. Bert 的结构和预训练任务
2.Bert 的 MLM 任务和 word2vec 的上下文预测中间有啥区别？
3. 知不知道 rag 用的 embedding 和 bert 的区别？
4. rag 检索会有啥优化？
5. lora 微调在显存上主要节省的是哪部分空间？（优化器）
6. 微调数据集怎么做的采样？怎么优化？
7. 强化学习的一些，DPO 的一些优化
8. attention 有哪些优化？（其实不太懂，我就说 GQA MQA）
其他的大部分八股都是很常见的，主要是最近被连续问了两次 embedding 相关，可以看看 bge 的预训练任务

代码
比较常规吧，有意思的是二分类器
输入 100 bs 的 64 维度输入和 Y label，自己实现 sigmoid BCE layerNorm，先过一个 Linear 再过 layerNorm 再过 Linear 再计算 loss 返回

全部评论

推荐最新楼层

落巡风

门头沟学院算法工程师

佬，现在都啥进展呀，，感觉现在都在泡池子呀。

2 回复分享

发布于 2024-09-27 19:13 北京

Lai点offer

门头沟学院算法工程师

rag 用的 embedding 和 bert 的区别，就是rag的会多一个检索的微调吧

1 回复分享

发布于 2024-10-16 18:08 四川

TYTY201903310226209

Washington University in St. Louis 算法工程师

佬第三题是 bert给的是token level的embedding但是rag用的embedding比如说openai的直接输出整句的么

点赞回复分享

发布于 2024-12-23 06:18 美国

3997095

北京航空航天大学算法工程师

佬，lora 微调在显存上主要节省的是哪部分空间？（优化器），不对呀

点赞回复分享

发布于 2024-09-27 21:20 北京

04-11 12:49

已编辑

香港中文大学（深圳）人工智能

【暑期实习】阿里云 AI Infra 二面复盘

项目深挖很多，也聊到了互联和软件硬件协同最近面了一场阿里云的 AI Infra 二面，整体感受是，这轮不是那种偏八股或者偏刷题的面试，更像是围绕项目经历一路深挖，看你到底有没有真的做过优化，也看你对自己后面想做的方向是不是足够清楚。开头还是常规自我介绍，我主要讲了自己现在在做的方向，包括 AI Infra、异构计算、底层性能优化，以及一些算子开发、图优化、推理优化相关的经历。后面的问题也基本都是顺着这些内容往下展开。前半段主要是在深挖项目。面试官先问了我现在做过的几类事情，我把内容归成了三块：一块是算子优化，一块是算子融合和图优化，还有一块是一些稳定性问题和 bug 修复。这里他问得比较细，不...

查看13道真题和解析

点赞评论收藏

04-11 15:07

哈尔滨工业大学 Java

腾讯二面。。。。。

面试官好专业，一直在问我架构，有的专业名词我听不太明白。。。。还有kafka也能算存储结构吗，我问了下ai，ai说不算。。。。

点赞评论收藏

02-25 16:10

门头沟学院 golang

什么逆天公司

让我填高考排名分数就算了，还问我大学努不努力，有无acm 队我要真打acm 还有必要找这种中厂水面试经验吗不管了瞎填吧，那就面试会会你，看看面试官有多抽象

找工作勤劳小蜜蜂：哥们建议你去投一下多益网络的岗位，马上就对以上的表格感觉良好，多益变态多了。

点赞评论收藏

03-19 17:53

武汉大学算法工程师

唉每每看到这张截图总是意难平

为什么面了八次次次都是一面挂，次次都不说原因，问了面试官就是插科打诨，为什么别人一面就过呢，真的没有缘分呀。不考编程就是脑筋急转弯的概率题，考了编程a了也不过没a也不过 总之就是不过，没一次二面，深深的怨念。觉得我不够资格就直接拉黑简历呗，每次都捞起来重新拷打一顿什么意思呢。

暴杀流调参工作者：春招又试了一些岗位，现在投递很有意思，不仅要精心准备简历，投递官网还得把自己写的东西一条一条复制上去，阿里更是各个bu都有自己的官网，重复操作无数次，投完简历卡完学历了，又该写性格测评、能力测评，写完了又要写专业笔试，最近还有些公司搞了AI辅助编程笔试，有些还有AI面试，对着机器人话也听不明白录屏硬说，终于到了人工面试又要一二三四面，小组成员面主管面部门主管面hr面，次次都没出错机会，稍有不慎就是挂。卡学历卡项目卡论文卡实习什么都卡，没有不卡的😂

点赞评论收藏