找不到实习的大摆子

2024-09-11 18:53 已编辑北京大学自然语言处理发布于北京

关注

字节应用一面

应该是某部门里的算法团队，有大模型相关的
1.自我介绍
2.项目详细拷打
3.长记忆这块除了 rag，你们有试过长文本模型吗？为什么不好？你们使用的扩充到 32K 的模型还是预训练本身就 32K 的模型？
4.你们记忆检索怎么检索的？有做什么优化吗？
5. 有没有了解过 loss in middle？（应该是这个？应该是说中间的注意下降吧？不是很懂这个原理）
6.DPO PPO 能讲一下它们的区别吗？有没有了解过更前沿的 RLHF？
7.DPO 里你刚刚说的 reject chosen 的 loss 里的概率是怎么计算的知道吗？
8. 简单讲讲 transformer bert 一类的模型的结构吧。
9.attention 公式是什么？为什么要除以根号 dk？
10. 你们模型效果怎么评估？上线有具体准确率之类的要求吗？
11. 安全对齐这块，你们有做样本分布统计吗？就是具体涉及到哪些类？

代码题最大乘积连续子数组

全部评论

推荐最新楼层

北京大学研发工程师

是被捞的还是主动投的呀等了几天被捞呢

点赞回复分享

发布于 2024-09-12 00:26 北京

北京大学算法工程师

今天刚通知我这个部门的三面过了

uu反问有仔细问相关业务吗

点赞回复分享

发布于 2024-09-11 17:10 美国

等一个offer的小学生很想回家

北京大学算法工程师

蹲一下是不是kpi 我也被捞起来了

点赞回复分享

发布于 2024-09-11 16:23 浙江

03-17 23:31

快手_后端开发

互联网大厂投递汇总（广州篇）

前言我的速成找实习/春招的经验帖子：链接我的学习后端和agent2手抓的专栏：链接第一梯队（互联网大厂）腾讯（微信总部）（天河）：微信/腾讯云广州研发中心网易（总部）（天河）：游戏 + 音乐 + 严选阿里巴巴（华南总部）（天河/海珠）：阿里云、电商字节跳动（分部）（天河/海珠）：抖音电商、研发中心百度Apollo（研发中心）（黄埔）：自动驾驶 + 智能交通京东（华南总部）（黄埔）：电商科技 + 供应链物流华为（研发中心）（白云）：5G通信 + ICT + 云计算第二梯队（细分领域）小鹏汽车（总部）（天河/番禺）：智能汽车研发 + 制造唯品会（总部）（天河/海珠/荔湾）：电商特卖 + 供应链欢聚...

暑期实习什么时候投？

点赞评论收藏

分享

03-10 17:45

门头沟学院推荐算法

字节实习大模型应用开发一面 90min

继续来分享下之前的面经~欢迎友好讨论，信息共享1.了解DeepSeek-R1吗?介绍一下?2.R1的MLA是如何实现KV-Cache的节约?3.R1在SFT时冷启动的目的?4.位置编码是什么?解释ROPE?5.一个14B的模型，推理和训练要多少显存?6.显存的占用和哪些因素相关?7.大模型灾难性遗忘是什么?如何解决?8.BF16、 FP16、FP32对比。9.Adam, AdamW原理。10.deepspeed的三个阶段。

点赞评论收藏

分享

03-20 13:41

中南大学算法工程师

台积电VS中芯国际

投票

想问问大家中芯国际（fab9）的智能化生产运筹管理工程师和台积电南京的智能制造工程师（制造部课长）哪个比较好

点赞评论收藏

分享

03-21 05:50

上海交通大学算法工程师

字节大模型应用开发实习一面 1h

给我面没招了，发点面经攒攒人品～1.实习拷打2.拷打第一个项目3.拷打第二个项目4.在RAG中，递归字符切片相比固定长度切片优势在哪？5.如果要实现只在特定分类的文档中进行检索，在Milvus中是使用多个Collection效率高，还是使用分区效率高？6.什么是Agent的反思机制，对于你的心理咨询Agent，有没有让模型在回答前先检查一遍自己的语气是否专业？7.工业图纸识别如果大模型出现了幻觉，你在Prompt层面或后处理层面有什么方法？8.介绍一下Function Call原理，模型生成的JSON如何通过逻辑触发表层代码执行并返回给模型？9.vLLM的PagedAttention原理？10.在使用FastAPI开发大模型接口时，中间件和依赖注入分别适合处理什么样的业务逻辑？11.Python的multiprocessing和threading你会如何结合使用来提高整体吞吐量？12.asyncio.gather和asyncio.as_completed在并发请求多个模型接口时有什么区别？如果其中一个接口超时，如何做降级？13.如果用户的Prompt特别长，导致上下文窗口溢出，除了截断，你有哪些简化上下文的策略？14.了解目前主流的MultiAgent框架吗？如果将你的心理咨询Agent拆分，你认为状态同步的难点在哪？15.谈谈对A2A通信的理解。在A2A场景下，如何防止两个Agent陷入递归对话？16.手撕：实现LRU缓存机制，有时间复杂度要求

查看15道真题和解析

点赞评论收藏

分享

03-21 04:30

门头沟学院 Java

字节大模型应用开发二面日常实习

发点面经攒攒人品～1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？6.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？8.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？9.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？10.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？11.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？15.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？16.针对大规模PDF解析这种任务，你选择多线程还是多进程？17.如何确保Agent返回的结果是标准的JSON格式？如果模型输出中有多余的说明文字，你在后端如何提取？18.场景题：对于RAG，如果检索到了针对同一故障的两份手册，内容相互冲突，请你设计一套逻辑，让模型能够识别冲突并优先选择时效性更高的信息？19.手撕：第k大元素

查看19道真题和解析

点赞评论收藏

分享

评论

9

25

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 简历上如何体现你的“AI”能力？ #

15928次浏览 344人参与

# 你是怎么和mt相处的？ #

101298次浏览 487人参与

# 华泰星战营，提前锁定校招offer #

13439次浏览 389人参与

# 找不到大厂实习可以去小厂吗？ #

21585次浏览 258人参与

# 打工人的工作餐日常 #

95420次浏览 542人参与

# 没有面试的日子里，你在做什么 #

13973次浏览 364人参与

# 26届秋招投递记录 #

123433次浏览 682人参与

# 哪些AI项目值得做？ #

25944次浏览 629人参与

# 如何准备秋招 #

81803次浏览 871人参与

# 你总挂在第__面？ #

11408次浏览 127人参与

# 实习时最怕听到的一句话 #

23059次浏览 197人参与

# 你想吐槽公司的哪些规定 #

47717次浏览 238人参与

# 联想求职进展汇总 #

355839次浏览 2259人参与

# 选择和努力，哪个更重要？ #

207283次浏览 1553人参与

# 你简历上最心虚的一句话 #

21774次浏览 233人参与

# 这份实习，有没有动摇过你的职业方向？ #

51495次浏览 284人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

200391次浏览 1187人参与

# 你知道最慷慨和最抠的公司分别是 #

10753次浏览 86人参与

# 正在春招的你，也参与了去年秋招吗？ #

398555次浏览 2742人参与

# 2022毕业的你对23届的寄语 #

68253次浏览 578人参与

# 秋招签约后的心态变化 #

126093次浏览 943人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务