关于写简历

阅读过的开源项目应该写在简历的哪个部分?是在项目经历那块,还是技能描述那块?
全部评论
技能部分,如果比较熟悉这块,就写上去,也不怕被问
点赞 回复 分享
发布于 2023-08-06 20:16 广东
开源项目是leveldb,如果写在项目经历哪里,太虚了,目前没时间复现一个,只有阅读经历
点赞 回复 分享
发布于 2023-07-30 11:15 湖北

相关推荐

祝大家都能拿到满意的Offer!1. 项目拷打2. 详细阐述Transformer的底层原理,并说明其能够替代RNN的核心优势;结合Transformer架构的成熟度,分析Self-Attention机制在多模态对齐任务中是否存在瓶颈,以及在实际业务场景中,是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理,说明LoRA是否仅能嵌入Linear层;分析LoRA无法在LayerNorm层之后插入的原因,以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验,说明QLoRA降低训练资源成本的核心逻辑;列举常见的模型量化方式,并解释QLoRA选择NF4与FP16组合而非其他方案的原因,阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后,decoder延迟仍居高不下的问题,分析潜在性能瓶颈;探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程,并结合实际应用场景举例说明。7. 结合过往RAG项目经验,讲解从数据清洗到检索服务上线的完整链路搭建流程,重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈,并阐述你在项目中采取过哪些优化手段来提升检索召回率(Recall)。9. 针对XX领域大模型的训练工作,说明SFT(监督微调)数据集的构造方法与核心思路。10. 结合LoRA微调实操经历,说明rank值的选择依据;在合并adapter权重的过程中,是否遇到过梯度爆炸问题,以及对应的解决方法。11. 结合你的模型部署相关经验,说明模型参数量与硬件算力需求之间的对应关系(例如不同参数量级模型所需的算力配置标准);以部署一个稀疏率千分之三的235B参数量MOE架构模型为例,估算其所需的算力规模。12. 在搭建RAG知识库时,若需对文档进行动态更新,你采用的是全量嵌入还是增量处理方案?若为增量处理,如何规避新旧文档数据分布不一致导致的检索偏差问题。13. 针对机械臂动作态融合相关工作,说明数据融合的具体实现方案,以及对比实验的设计思路与评估指标。
查看12道真题和解析
点赞 评论 收藏
分享
自我介绍以后开始拷问:项目:1,如何做到筛选视频困难样本的(只有这个答得有点曲折,也记不清项目里面是怎么做的了,其他答得还好的都记不清了,后面也知道了这个经历和公司业务内容强相关)八股:A。面试官说先从Python基础问起(问之前还确认了我用C还是用Python):1,Python里面可变对象跟不可变对象的一个区别,及其含义,以及模型训练当中怎么用2,Python里面可变对象包括什么,元组算不算可变对象3,对上一个的follow up:可变对象和不可变对象的本质区别?也即list能不能作为哈希表的key?(可能因为上一个问题答得隔靴搔痒没有切中面试官的心意)4,什么是全局解释器锁GIL,在这种情况下怎么进行多线程编程5,什么情况下会用多进程什么时候会用多线程6,多进程之间做并发的话怎么去做数据共享以及同步互斥(一开始自己回答了Lock,后来面试官提示是多线程之间做的并发,于是端上了Event和Semaphore Quene等)7,了解过Python装饰器的作用吗,在代码里面有没有用过,它的原理是什么8,Python在数据处理当中常见的性能优化手段9,10个T的视频数据浏(浏览数据或者点赞数据),想去统计这些数(每个视频的观看人数和点击人数)。这个东西用Python来写的话,会怎么去写(后续补充:在本地的机上面处理,而不是说用分布式那种那个来处理。10个T还不至于一定要上分布式)B,计网:1,HTTP跟HTTPS区别和联系C,数据库1,了解数据库事务吗,简单讲讲2,LEFT JOIN 和INNER JOIN的区别(但是本人对数据库实在不熟不知道有没有听错问啥……)D,大模型Transformer里面会用那个Flas Attention跟那个Paged Attention去优化,它们的那个区别跟那个原理是什么代码手撕:最长回文子串,不过是直接返回子串面试官看我补全代码以后捉了点bug就没说别的了,问了问时间复杂度以及有没有比动归更好的解法(此外我听过一个说法,说如果面试官直接问你hot100原题就是很想招你进来了,我不清楚)反问环节:1,这个实习岗位具体做什么?业务场景是什么?——主要围绕 TikTok 直播的音视频内容理解与标签体系建设。在连麦、试音等场景下,对内容进行识别后自动打玩法/分类/风格等标签。目标是提升标签质量(准确率/覆盖率等)并推动自动化。工作会包含线上推理服务与工程链路设计,配合策略/算法团队做模型与策略调优2,使用什么模型对数据打标签?开源还是闭源?——同时会做开源与闭源大模型的对比实验,效果好的方案会通过实验与切流获得更多流量。根据内容来看感觉这个应该是加了AI调用和提示词工程的python后端开发,整体更偏工程,也无怪乎大模型这块也就问了这么点btw喜茶的提拉米苏浓巧好喝
查看17道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务