长鑫存储 半导体数据科学 二面面经

全程25分钟

1.自我介绍

2.介绍完问我为什么报这个岗位,我说对数据科学比较感兴趣

3.直接甩出来一道场景题,问我假如说有一个芯片检测场景,想通过大模型预测未来的时间序列,该怎么做,我就说提示工程啥的,他说假如说微调阶段做的话咋做,我说了一下我的理解,他又问假如说预训练阶段做咋做,我说了我的理解;说的过程中被拷打,汗流浃背了

4.问我会不会集成学习模型底层原理,我说我主要是在比赛中用,他让我讲一下特征工程怎么做,我就讲了一些

5.反问,问部门做什么的,说是做芯片生产相关的异常检测,还有大模型在芯片领域的探索啥的

无手撕

——————————————

更新,当晚系统状态由复试-面试评估变为签核-录用评估,开始泡池子

#牛客创作赏金赛#  #实习,投递多份简历没人回复怎么办#  #算法面试分享#  #实习,投递多份简历没人回复怎么办#  #找实习多的是你不知道的事#
全部评论
感觉这个就是海面然后泡池子啊,我完全不对口的专业,现在也待评估了,不过感觉应该是要拒了,硬件感觉完全没吸引力
1 回复 分享
发布于 2024-08-09 21:59 河北
状态更新了tt我,我也是今天上午刚二面完
1 回复 分享
发布于 2024-08-09 11:08 四川
请问收到offer了吗
点赞 回复 分享
发布于 2024-09-07 16:59 上海
😢佬你现在是啥状态了啊
点赞 回复 分享
发布于 2024-09-05 15:51 上海
好家伙 我也是刚面完 基本就是聊天 问了我小八股 状态更新dd
点赞 回复 分享
发布于 2024-08-09 17:27 山东
佬,我也今天面的,但为啥基本没有啥专业知识,一共二十分钟不到
点赞 回复 分享
发布于 2024-08-09 16:35 安徽

相关推荐

被横向挂了,希望发出来对大家有帮助!1* 简单概述你简历中的两个项目,包括项目背景以及你的具体分工,是独立完成还是团队协作2* 项目的数据来源是什么?你是如何确定优化目标的?3* 比如数据从 100 条扩充到 1.2 万条,是否全通过自动化生成?生成的样本具体是什么样的?举个例子说明一下生成前后的对比4* 怎么保证自动化生成数据的正确性呢5* 在通过调整参数直到模型回答正确为止的过程中,是否意味着生成的CoT中存在错误逻辑?6* 经过数据清洗后,最终用于SFT的有效数据量是多少?7* 在做微调时,除了 LoRA 是否对比过其他的微调算法8* 你是如何评价微调效果的?测试集的比例是多少?微调前后的准确率分别是多少?原有的模型性能保留了多少?9* LLM常用的结构是什么?10* 说一下Transformer 的整体结构11* 目前主流大模型最常用的位置编码是什么?。12* 写一下多头注意力机制的数学公式。13* 公式中为什么要除以 \sqrt{d_k}?其对梯度消失或梯度爆炸有什么影响?14* 在 Transformer 的 Encoder 和 Decoder 中,哪些部分是可以并行计算的,哪些不可以?15* 除了 LoRA,你还了解哪些微调方法?16* 大模型训练通常使用什么损失函数17* 在机器学习基础中,二分类问题、多分类问题以及回归问题分别使用什么损失函数?18* 你了解哪些优化算法19* 模型训练中出现过拟合的常用解决方案有哪些?20* Dropout 在训练阶段和预测阶段的处理方式是否一致?为什么要这样做?21* 大模型中的“复读机问题重复生成是什么原因导致的?如何从解码策略或训练层面解决?22* 幻觉问题产生的原因是什么?目前常用的工程解决方案有哪些?23* 写出逻辑回归的数学公式。
点赞 评论 收藏
分享
评论
5
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务