02-06 09:35 西安交通大学算法工程师

关注

大模型LLMs微调面经总结超全版

1.如果想要在某个模型基础上做全参数微调，究竟需要多少显存?
2.为什么SFT之后感觉LLM傻了?
3.SFT 指令微调数据如何构建?
4.领域模型Continue PreTrain 数据选取?
5.领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘通用能力?
6.领域模型Continue PreTrain ，如何让模型在预训练过程中就学习到更多的知识?
7.进行SFT操作的时候，基座模型选用Chat还是Base?
8.领域模型微调指令&数据输入格式要求?
9.领域模型微调领域评测集构建?
10.领域模型词表扩增是不是有必要的?
11.如何训练自己的大模型?
12.训练中文大模型有啥经验?
13.指令微调的好处?
14.预训练和微调哪个阶段注入知识的?
15.想让模型学习某个领域或行业的知识，是应该预训练还是应该微调?
16.多轮对话任务如何微调模型?
17.微调后的模型出现能力劣化，灾难性遗忘是怎么回事?
18.微调模型需要多大显存?
19.大模型LLM进行SFT操作的时候在学习什么?
20.预训练和SFT操作有什么不同
21.样本量规模增大，训练出现OOM错
22.大模型LLM进行SFT 如何对样本进行优化?
23.模型参数迭代实验

全部评论

推荐最新楼层

昨天 17:02

已编辑

南昌大学 Java

中国交易与广告方向--客户端暑假实习这期神了，考的老难了，面的满头大汗（不是形容词是真的面完满脸通红）压力面，不停打断，话不多说直接开始1.说说你这个项目的作用，以及你做这个项目的动机2.项目的核心功能是？（面试官来自客户端的居然也会所有后端的东西，确实非常的厉害我还以为像前两面的面试官后端的东西一点都不会）3.说说项目里feed流的架构设计4.让我们想象一个场景啊，假如你项目这个feed流，他的用户量变成抖音这个量级，你该怎么办5.你这是个单体的小项目，如果要把她变成一个超大的巨型项目，你的核心组件的架构该怎么变6.你的项目里写了并发控制，然后就是超卖，什么是超卖，超卖如何解决7.能百分百解...

allin校招的烤冷...：懂你兄弟，太难受了

我的求职进度条

点赞评论收藏

分享

05-28 10:45

华为OD--5月27日机考复盘

香云昨天全程跟进完5 月 27 日华为 OD 机考第一场，也是五月的最后一场。从考生登录、答题、提交到结果统计，一路看下来真的有太多想跟大家说的。今年 OD 求职的同学真的特别不容易，二战考研失利、脱产空档、双非想进大厂、转行从零开始…… 各种情况都有，像我之前对接的一个桂林电子科技大学的同学，二战考研没希望，2 月份紧急投递 OD，最后顺利入职长沙 CTS 部门测试岗，这种低门槛、重能力、不卡学历的机会，在大厂里真的不多了。说回本次机考，整体难度非常稳定，两星一星 + 一星二星结构，和往期风格一致，不搞偏题怪题，但细节决定生死。第一题班长选举，是经典的模拟题，考字符串处理、哈希统计、重名规则...

点赞评论收藏

分享

05-20 18:38

北京大学 Java

怎么改改啊😭

_小趴菜_：北京大学加大加粗就够了

点赞评论收藏

分享

05-13 16:17

门头沟学院 Java

双非本怎么办

现在找个10k的工作都需要92学历了吗

karis_aqa：其实是8k

我的求职进度条

点赞评论收藏

分享

05-28 14:48

禅游科技_java后端开发(实习员工)

继续实习VS暑假沉淀，怎么选....

先说说本人情况，实习快两个月了，目前实习节奏和强度始可，现在是在做新需求，我参与的也比较多，从前辈身上也能学非常多东东西，mt和组员都非常好非常包容，昨天下班后还一起聚餐了，目前整体的团队氛围我很喜欢。前两周mt还主动和我1对1谈话，觉得我最近做的不错，这两周结束后看表现会去跟N+2求转正资格，爽之爽之。但是现在实习话感觉人班味越来越重了,下班后就想赖床上不想学新东西，面经也很少看，现在有接到面试全推到端午后了，平常根本就没精力去备面试，在这边实习后心态也有很大的变化，对学校里的课程的重视程度也在不断降低，越到后面越在思考学校的意义是不是就在于有个学位证，有点话密了。现在也挺迷茫的吧，想听听牛...

实习生的蛐蛐区

点赞评论收藏

分享

评论

1

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 27届实习投递记录 #

171819次浏览 1704人参与

# 拼多多集团-PDD笔试 #

114049次浏览 699人参与

# 拼多多工作体验 #

68538次浏览 465人参与

# 求职遇到的搞笑事件 #

201598次浏览 1026人参与

# 体制内上岸心路历程 #

39948次浏览 231人参与

# 找工作时遇到的神仙HR #

1252916次浏览 5957人参与

# 小米求职进展汇总 #

1084857次浏览 6551人参与

# 国庆前的秋招小结 #

305239次浏览 1758人参与

# 硬件人秋招进展 #

298178次浏览 4055人参与

# 满分简历要如何准备？ #

323391次浏览 3385人参与

# 得物app工作体验 #

71271次浏览 125人参与

# AI时代下，你的岗位要求有什么变化？ #

43423次浏览 290人参与

# 我的AI电子员工 #

45249次浏览 262人参与

# 万物皆可发面经 #

7202次浏览 88人参与

# 通信和硬件还有转码的必要吗 #

110967次浏览 648人参与

# 今年找实习到底有多难？ #

109723次浏览 501人参与

# 扒一扒那些奇葩实习经历 #

161454次浏览 1185人参与

# 重来一次，我还会选择这个专业吗 #

479638次浏览 4012人参与

# 26届校招投递进展 #

684178次浏览 3970人参与

# 秋招开始捡漏了吗 #

251004次浏览 1065人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务