我的算法求职之旅

好久没有发帖了,正好发现有在做活动,就来发帖拿拿奖励 XD。

准备阶段

我对校招其实感觉还是准备的比较早,大概研二刚开学就开始感觉需要找工作了,当时在学校里面有一些开发的项目,但是和自己准备找算法方向工作的意向不是非常匹配,因此就一般摸鱼在导师哪儿写项目,一边自己准备算法相关的项目。

我自己首先准备了两个项目,一个是毕设方向,实现了下 Baseline 然后略作一些修改,然后另外一个是一个自动微分求导框架的项目,实现了一些基本的算子可以做简单的 MLP 模型自动反向传播。除了这些自己写着的项目,还额外把研一写的一些大作业稍微规范和包装了下,以及参加一些天池 or Kaggle 的比赛(缺悲惨的场场打铁)。

有了这些经历后,感觉对于算法工程师岗位其实还不够,因为我们一般认为优秀的简历需要:1. 论文(短时间无法弄出来);2. 比赛(打铁没成绩);3. 实习,所以希望能够找到一份实习来支撑自己的简历。

实习经历

上述的准备阶段大概在 12 月份就完成了,当时搜了搜附近的公司想要找一份能够在寒假的实习,巧了不是,距离学校三个地铁站的爱奇艺正好在招实习生,于是赶紧投递,结果下午就联系面试,然后约三天后进行面试。

爱奇艺的面试是我人生的第一次面试,当时做地铁到公司在一个小隔间里面进行面试,在墙上画了自己论文的方案,然后做了一道简单的恢复二叉树(当时自己完全忘了准备做题还好出的简单),简单沟通下就可以快乐的上班了。

实习主要做文本生成方向的一些模型,大概做到了春节,实现了两个版本模型,过程都还算愉快。结果春节在家几天就碰见疫情了,远程工作了几天感觉反而事情变多了,而且项目组准备切换方向文本生成可能不再 follow 了,于是就辞职了。

辞职后在家主要是复习准备春招找暑期实习,这个阶段就是刷题和八股文,因为我以前本科略微做过一些 ACM 题目因此感觉刷题还是比较简单,大概每天 2-3 题的进度。春招期间先找了几个小公司准备练练手,结果小公司完全不按常理出牌,不是常规的面试,给了场景让写一下模型然后过几天给他们...后面就是常规的面试,大家可以看我之前发在牛客的暑期实习面经,最后想着可以边划水边复习秋招因此选了微软。

秋招

当 6 月看着京东提前批开始了,突然开始慌了起来,赶紧回了学校,然后重新拿起八股文开始背。我的秋招感觉主要聚集在 7 月 15 日 - 8 月 15 日,这个阶段基本就是直接约面试,没有笔试,前期就被面试冲击懵了,感觉基本可能每天都有面试,寝室的小伙伴也都回来了,最经典的一天出现了四人同时在寝室面试...

秋招阶段的面经在牛客也有发:秋招面试面经

总结

对于学弟学妹们准备找算法方向工作的,对秋招关注一定要趁早,以及打消找小公司练手的念头,要练手就只能春招练手,秋招大公司开始时间都比小公司早,根本不可能练手。以及春招能拿多少 offer 尽量拿,大部分公司都有绿色通道,没有也会提前联系,比如美团如果实习拿了 offer 没去,秋招就能加快面试流程,我拿了腾讯的 Offer 结果腾讯官网都还没更新校招日历就联系面试了,然后发了意向。

算法岗位一定要夯实基础,比如自己做的模型的事情,同时也不要忘了工程的基础,现在很多 ai 算法其实就是 97% 到 97.5% 的改进,这些改进其实对于公司的收益而言并不是非常重要,但是能不能把这个算法在公司的生产环境上走通这一点是非常重要的,因此也希望做算法的同学能够把计算机基础打牢,做好算法也要做好工程,只会 SVM 就能拿 Offer 的时代已经过去了。

#这样我就上岸了##学习路径#
全部评论
点赞 回复 分享
发布于 2021-09-06 10:29
@sunnyyyy01 大佬快来帮忙看看
点赞 回复 分享
发布于 2021-09-04 12:00

相关推荐

结合最近辅助修改的简历及项目,老师总结了部分大模型微调简历的踩雷点。🙅‍♂️错误示范:在 x任务中,获取 xxx 条数据,通过规则 or 脚本清洗出 x 条数据,然后微调 y 大模型,在业务上提升 x 个点。✍🏻原因:大模型微调的平台是现成的,基模是现成的,体现不出核心能力。✅应该怎么写?首先介绍业务背景:业务是一个销售对话业务,机器人是销售,代替真人,直接面对用户。我们会给模型设定任务,任务是 prompt 。步骤1️⃣.提取训练数据问题:1.真人通话每通电话任务是未知的,我们训练数据是任务+通话的 pair 对。2.真人通话很乱,与客户的对话是各种交叉的,导致 asr 后并不是一人一轮。解决方案:1.首先通过大模型 prompt 对该通电话提取任务,得到任务+ pair 对。需要用到 cot + reflection +多 Ilm 一致性+ debating 的模式。2.使用大模型根据以上任务和真人对话,让大模型编写出通话内容。提问,为什么要编写而不是直接用?步骤2️⃣.制定训练数据集问题:1、正常的对话内容,前面几句和后面几句基本上一致的。都是问候和拜拜,但是也有一些差异。2、因为都是相似场景,虽然任务不同,但是很多场景语义很相似。解决方案:1、基于轮次的权重采样:通过轮次设定权重进行 weighting sample 。解决问候和拜拜的高占比问题。2、基于语义的采样:使用 bert 对对话内容进行 embedding ,然后使用层次聚类通过调节阈值聚类出相似语义的类。对一个类里的样本进行随机采样,提问,为什么要对重复语义的数据进行下采样?3、基于客户类型和产品的采样,因为很多产品是热品,导致对话内容有偏,用户类型一样,需按照类型调整整体比例采样。提问,为什么要这么采样?步骤3️⃣.制定训练数据集我们直接把输出当作 target 进行训练。使用的 lora 训练,但是 lora alpha 设定成为4倍的时候达到了比较好的效果,经验值不同任务不一样,提问,在各种情况下要怎么调?步骤4️⃣.dpo训练问题:v1版本训练时,很多输出内容是对的,但是输出的语气不太像真人,机器人味还是很严重。解决方案:由于训练本身是有 ground truth 的,因此使用v1训练的模型,预测训练集,使用大模型对比两者语气不符合训练集的拿出来,使用训练集的 ground truth 和模型的预测数据作为 dpo 训练对,对v1版本模型重新训练。📳这里老师只是简要进行概括解答,具体情况和详细解答可以咨询辅导,如果想了解项目辅导,提升面试能力,欢迎后台联系。    
点赞 评论 收藏
分享
在AI Agent的设计中,意图识别是自然语言理解(NLU)的核心环节,直接影响用户体验和业务目标达成。作为AI产品经理,需从业务场景、技术实现和用户体验三个维度系统设计意图识别方案1. 明确业务需求与意图分类体系- 场景拆解:根据Agent的应用场景(如客服、智能家居、电商导购)梳理高频用户诉求。例如:- 客服场景:咨询、投诉、退款、查询进度等- 智能音箱:播放音乐、设置闹钟、控制设备- 意图分层设计:采用树状结构(主意图→子意图→槽位),避免分类粒度混乱。例如:主意图:订机票├─子意图:查询航班(槽位:出发地、目的地、日期)└─子意图:改签机票(槽位:订单号、新日期)- 兜底策略:设计"未知意图"分类,结合澄清话术(如“您是想查询订单还是联系客服?”)或转人工流程。2. 数据驱动的模型构建- 数据采集与标注:- 通过用户历史对话、搜索日志等获取真实语料。- 标注时需注意同义表达覆盖(如“帮我订票”和“买张去北京的机票”)。- 技术选型方案:- 规则引擎(正则表达式、关键词):冷启动阶段/高确定性场景(如命令词)- 深度学习(BERT、TextCNN):复杂语义场景- 大模型微调(Few-shot Learning):长尾意图识别- 多模型融合:规则兜底+模型预测,例如先用规则处理高频意图,剩余流量走模型。3. 用户体验闭环设计- 容错机制:- 置信度阈值设置(如低于0.7时触发澄清)- 上下文继承(用户说“换一个时间”时继承前文航班查询意图)- 效果评估指标:- 技术指标:准确率、召回率、F1值- 业务指标:任务完成率、转人工率、单次对话解决率(FCR)- 用户感知:用户主动纠正次数、满意度调研- 持续迭代闭环:- 建立bad case分析流程,将误识别样本反馈至标注池- 监控意图分布变化(如新增促销活动可能引发未覆盖的咨询意图)的         
点赞 评论 收藏
分享
在AI产品设计中,Agent(智能体)和Workflow(工作流)是两种核心范式,分别代表了智能化与流程化的不同方向。要从以下方面展开分析:一、核心区别二、Agent的核心特性三、Workflow的设计逻辑四、协同关系五、选择决策要点具体来说:1. 定义与功能:   - Agent:自主决策实体,能感知环境、做出决策并执行动作   - Workflow:预定义的任务序列,按照固定流程执行2. 执行方式:   - Agent:动态响应,根据输入和环境变化自主调整行为   - Workflow:线性执行,严格遵循预设步骤3. 灵活性:   - Agent:具备学习适应能力,可处理未知情况   - Workflow:静态结构,变更需要手动修改流程4. 决策能力:   - Agent:内置决策逻辑,可实时评估选择最佳路径   - Workflow:无自主决策,完全依赖流程设计5. 复杂度:   - Agent:通常包含状态记忆和目标导向行为   - Workflow:侧重任务编排和顺序控制6. 典型应用:   - Agent:聊天机器人、自动驾驶、游戏AI   - Workflow:数据处理流水线、审批系统、CI/CD流程7. 错误处理:   - Agent:可自主尝试恢复或寻找替代方案   - Workflow:依赖预设的错误处理分支总结:Agent是“大脑”,Workflow是“骨架”,二者结合可构建从灵活到稳定的AI应用光谱。未来方向是通过低代码平台降低两者融合门槛,实现智能化与自动化的统一。      
点赞 评论 收藏
分享
评论
4
5
分享

创作者周榜

更多
牛客网
牛客企业服务