算法求职简历该怎么写大模型微调

结合最近辅助修改的简历及项目,老师总结了部分大模型微调简历的踩雷点。
🙅‍♂️错误示范:在 x任务中,获取 xxx 条数据,通过规则 or 脚本清洗出 x 条数据,然后微调 y 大模型,在业务上提升 x 个点。
✍🏻原因:大模型微调的平台是现成的,基模是现成的,体现不出核心能力。
✅应该怎么写?
首先介绍业务背景:
业务是一个销售对话业务,机器人是销售,代替真人,直接面对用户。我们会给模型设定任务,任务是 prompt 。
步骤1️⃣.提取训练数据
问题:
1.真人通话每通电话任务是未知的,我们
训练数据是任务+通话的 pair 对。
2.真人通话很乱,与客户的对话是各种交
叉的,导致 asr 后并不是一人一轮。
解决方案:
1.首先通过大模型 prompt 对该通电话提取任务,得到任务+ pair 对。需要用到 cot + reflection +多 Ilm 一致性+ debating 的模式。
2.使用大模型根据以上任务和真人对话,
让大模型编写出通话内容。提问,为什么要编写而不是直接用?
步骤2️⃣.制定训练数据集
问题:
1、正常的对话内容,前面几句和后面几句基本上一致的。都是问候和拜拜,但是也有一些差异。
2、因为都是相似场景,虽然任务不同,但是很多场景语义很相似。
解决方案:
1、基于轮次的权重采样:通过轮次设定权重进行 weighting sample 。解决问候和拜拜的高占比问题。
2、基于语义的采样:使用 bert 对对话内容进行 embedding ,然后使用层次聚类通过调节阈值聚类出相似语义的类。对一个类里的样本进行随机采样,提问,为什么要对重复语义的数据进行下采样?
3、基于客户类型和产品的采样,因为很多产品是热品,导致对话内容有偏,用户类型一样,需按照类型调整整体比例采样。提问,为什么要这么采样?
步骤3️⃣.制定训练数据集
我们直接把输出当作 target 进行训练。使用的 lora 训练,但是 lora alpha 设定成为4倍的时候达到了比较好的效果,经验值不同任务不一样,提问,在各种情况下要怎么调?
步骤4️⃣.dpo训练
问题:v1版本训练时,很多输出内容是对的,但是输出的语气不太像真人,机器人味还是很严重。
解决方案:由于训练本身是有 ground truth 的,因此使用v1训练的模型,预测训练集,使用大模型对比两者语气不符合训练集的拿出来,使用训练集的 ground truth 和模型的预测数据作为 dpo 训练对,对v1版本模型重新训练。
📳这里老师只是简要进行概括解答,具体情况和详细解答可以咨询辅导,如果想了解项目辅导,提升面试能力,欢迎后台联系。
#算法# #简历中的项目经历要怎么写# #算法岗面试# #互联网大厂招聘#
全部评论

相关推荐

很多人问我如何准备大模型的面试,分享下我的经验,针对两种情况:1. 有大模型实习2. 无大模型实习针对无大模型实习的情况,我建议先找一段中厂实习为主,比如 zhipu、Minimax (当然有大厂进大厂)这些,相对容易进,尽量积累大模型实习经历。针对有大模型实习的情况,复习内容为:1. 常规八股(transformer、bert 等)2. 最新八股(GQA 等)3. 技术报告(一定要自己看原PDF,目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL)4. 手撕 Leetcode:Hot1005. 手撕模型,比如 MHA 这些首先是常规八股和最新八股,这一部分可以自己找找网上资料,整理好的,背。然后是技术报告,目前推荐的内容有:1. DeepSeekV3:必读2. DeepSeekR1:必读3. Kimi1.5:选读4. Minimax-01:选读,据我所知最长上下文模型(外推到 4M,不过好像被 LLama4 的 10M 超过了)5. Qwen2.5:必读6. LLama3.1:必读7. Qwen2.5-VL(如果简历有多模态内容):选读重点关注:1. 阶段训练(预训练几段、Post-training 几段?上下文用了多少?数据配比是什么?)2. 模型创新点(MHA 创新是什么?作用是什么?)3. 上下文优化创新点(一般是优化显存和阶段训练)4. 多模态优化创新点(简历有多模态内容)5. 几个模型不同之处(比如 Qwen2 和 Qwen2.5 的不同之处)最后是手撕,Leetcode 只刷 Hot100 够了,模型手撕建议关注(我目前会的):1. MHA2. LayerNorm3. Transformer Encoder (MHA+LayerNorm+FFN)4. PE(绝对位置编码)5. ROPE6. SwiGLU7. RmsNorm每次面试前快速过一遍就 ok 了。
喜欢吃卤蛋的托尼of...:大佬想问下项目该怎么准备
查看19道真题和解析
点赞 评论 收藏
分享
评论
2
17
分享

创作者周榜

更多
正在热议
更多
# AI面会问哪些问题? #
24960次浏览 492人参与
# 中国电信笔试 #
31122次浏览 283人参与
# 厦门银行科技岗值不值得投 #
7513次浏览 186人参与
# 你的实习产出是真实的还是包装的? #
18867次浏览 330人参与
# 如果秋招能重来,我会____ #
96710次浏览 500人参与
# 春招至今,你的战绩如何? #
60246次浏览 547人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
14193次浏览 209人参与
# i人适合做什么工作 #
36934次浏览 124人参与
# 我是面试官,请用一句话让我破防 #
79529次浏览 219人参与
# 哪些公司真双非友好? #
69218次浏览 287人参与
# 金三银四,你的春招进行到哪个阶段了? #
21574次浏览 277人参与
# 找AI工作可以去哪些公司? #
7738次浏览 188人参与
# 从事AI岗需要掌握哪些技术栈? #
7730次浏览 251人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
339952次浏览 2165人参与
# 面试尴尬现场 #
220775次浏览 861人参与
# 五一之后,实习真的很难找吗? #
102811次浏览 584人参与
# 你做过最难的笔试是哪家公司 #
30318次浏览 193人参与
# 你小时候最想从事什么职业 #
159844次浏览 2072人参与
# 应届生第一份工资要多少合适 #
20489次浏览 84人参与
# 阿里笔试 #
176531次浏览 1302人参与
# 一张图晒出你司的标语 #
3843次浏览 72人参与
# 面试被问期望薪资时该如何回答 #
382478次浏览 2163人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务