小北的求职树洞

2025-04-02 13:07 哈尔滨工业大学产品经理发布于北京

关注

面试官：大模型微调需要多少数据量？

1. 核心影响因素
- 任务类型：
- 简单任务（如文本分类）：可能需数百到数千条标注数据。
- 复杂任务（如对话生成、阅读理解）：通常需数万条甚至更多数据，尤其需多样性和高质量样本。
- 模型规模：
- 大参数量模型（如GPT-3、PaLM）可能需更多数据防止过拟合，但通过策略（如参数冻结）可降低需求。
- 较小模型（如BERT-base）可能在较少数据下表现良好。

核心是数据质量：

- 高质量、标注精准、多样化的数据可显著减少需求量。
- 低质量数据可能导致模型性能瓶颈，需额外清洗或增补。

领域差异：
- 若预训练数据与目标领域差异大（如通用→医疗），需更多领域数据调整模型分布。
- 训练策略：
- 正则化技术（早停、Dropout、数据增强）可缓解小数据过拟合。
- 迁移学习技巧（如Adapter、LoRA）可减少可训练参数量，降低数据需求。

经验可参考范围
- 常规任务（分类/标注）：
- 小模型（如BERT）：1k-10k样本。
- 大模型（如GPT-3.5）：可能需10k-50k样本（结合领域适配策略）。
- 生成任务（对话/摘要）：
- 通常需5k-100k+样本，依赖生成质量要求。
- 领域适配：
- 若领域差异大，需额外增加20%-50%数据量。

产品经理的权衡维度
- 业务目标：
- 若需快速验证MVP，可接受小数据+低精度（如数百样本），后续迭代优化。
- 若追求高精度（如医疗、金融场景），需预留足够标注预算。
- 资源限制：
- 标注成本：若数据获取昂贵，需优先优化数据质量或采用主动学习。
- 算力与时间：大数据量需更高训练成本，需权衡ROI。
- 替代方案：
- Prompt Engineering：用少量样本设计提示词，可能无需微调。
- Few-shot Learning：结合模型原生能力减少数据依赖。

#牛客激励计划# #聊聊我眼中的AI# #数据人的面试交流地# #AI了，我在打一种很新的工# #面试被问期望薪资时该如何回答# #面试题刺客退退退# #大家都开始春招面试了吗# #24届软开秋招面试经验大赏#
#牛客AI配图神器#

全部评论

推荐最新楼层

01-01 22:23

已编辑

门头沟学院 C++

白菜博士秋招经验分享

TLDR：如果是做LLM等热门方向的同学，直接看 @丁霄汉 的分享就行了。 丁博无敌。BG：双9做系统相关，有相关实习，论文算中位数水平？目前Offer情况：🔵青云9，🌸18，🟠6+，🎶2—2，...写这篇文章还是那个目标：和大家分享一些非头部水平的普通博士生秋招经验。实习+秋招一共面了小五十场，加了快20个HR。其实我BG挺一般，但今年可能也因为整体行情起来了，所以最终结果还是比较满意。时间线：我秋招基本9月中旬开始面，密集期到10月底结束。11月到1月还有一些零散面试（基本是特殊面试，比如各种加面）。今年整体都比较晚，我也比较佛系，没怎么催过流程。各家HR在决定时间上普遍也给了很大...

投递阿里巴巴等公司10个岗位

点赞评论收藏

分享

2025-12-23 22:03

库洛游戏_系统策划(准入职员工)

步步高内推，步步高内推码

步步高实验学校 2026届校招启动啦【学校简介】东莞市步步高实验学校于 2023 年投入运营，占地 230 亩，是一所集幼儿园、小学、初中、高中于一体的十五年一贯制非营利性高端民办学校，学校全面实行小班化教学，学校师生比为 1:5；步步高教育专家团队由来自一流大学的国家课标专家、教育学家，来自著名学校的卓越校长，来自一线、有着丰富教学经验的著名特级教师，以及来自国家级教育媒体的教育策划专家共同组成，为步步高的课程、教学、管理奠定了坚实基础。【招聘岗位】• 幼儿园、小学部及初中部各学科类教师 & 国际教师，类别多多，等你pick！ 【福利待遇】• 薪资：幼儿园老师年收入16万起 、中小学...

投递小天才等公司10个岗位

点赞评论收藏

分享

2025-12-06 01:10

已编辑

哈尔滨工程大学 Java

一面问的真细，二面不知为啥变双机位。9.29快手主站平时怎么学习 AI 的，国内外知名大模型，实习公司都用的什么大模型，怎么评估效果的java池化思想，线程池构造方法的核心参数，线程池中阻塞队列注意事项，submit方法参数和执行逻辑，shutdown和shutdownnow，核心线程允许过期吗threadlocal底层，为什么key是弱引用，key回收了再get或者set这个value会怎样aqs，如何保证公平性java代理java堆划分，新生代还有别的晋升老年代的情况吗，什么时候触发gc，gc失败抛什么异常，如何排查oom，导出dump命令redis数据结构，哪个底层是跳表，和其他数据结构对比布隆过滤器会出现大key问题吗，你咋实现的布隆过滤器你怎么实现redis分布式锁，可重入，续期聚簇索引非聚簇索引select语句会加锁吗，怎么实现的不加锁undolog redolog binlog怎么能让select加锁，update这个范围加的什么锁，update一条呢手撕简单01背包，接雨水10.10快手主站意图识别用的哪个大模型，走到意图和rag的比例，faq是点击的吗自然语言怎么识别的gap一年干啥了，转正怎么样没跟组里提意向吗，研究生研究方向是传统算法吗，会大模型微调吗注册场景为什么用布隆过滤器，原理分布式锁底层的key怎么拼的，value里是什么redis持久化zset底层mysql索引结构，一个表三个字段有主键唯一索引和没索引的字段会有几个b+树，聚簇索引非聚簇索引存的啥无手撕

点赞评论收藏

分享

2025-11-05 10:55

中南大学 Java

小米面试官：你是唯一一个自我介绍还要对着简历讲的人

之前小米一面的时候，面试官让我自我介绍，我为了让面试官能跟上我的节奏，主动共享屏幕，然后对着简历上的实习经历和项目整体的架构图讲整个流程，但是讲完之后，爆发了一些矛盾：面试官说：“你对你的实习经历还不熟悉吗？还要对着简历讲”我说：“我这是为了让我讲的更加清楚，因为单靠口头描述的话，怕有点抽象，不大好理解”面试官说：“你都还没讲呢，怎么知道我不能很好的理解呢？”我说：“因为在这短短的几分钟之内，靠口头描述一个系统确实很抽象，所以想照着这个架构图讲”接着面试官说了这样的一句话：面试官说：“面试了这么多学生，你是唯一一个自我介绍还要对着简历讲的人”我心里一下子就恼火了起来，对着喷：我说：“经历了这么多场面试，你是唯一一个面试官对我共享屏幕有意见的”后续面试，他也只会问些Java八股问题，我也给他吟唱了一番，然后手撕的时候，由于有点不熟练了，再加上要跟朋友出去按摩，后面就说不想撕了，后面就去按摩去了。后续的结果竟然过了，但是一想着这面试官要做我的mt，后面就拒了后续流程了。

要双修的猫头鹰：这面试官怕不是个m

我来点评面试官

点赞评论收藏

分享

2025-12-30 10:27

天津大学 ARM工程师

秋招G了,春招还能翻盘吗?

刚刚结束的秋招中，有人欢喜有人忧。欢喜的是，有些同学找到了不错的工作；忧愁的是，也有同学没有心仪的去处。秋招和春招，是学生们心头的两个坎，之前看师兄师姐们或优雅或费力的迈过这些坎，感触并不大。终于，在毕业的前一年，也轮到了我们自己。第一次经历，自然心头有着不少疑惑。今天从计算机行业出发，我带你抽丝剥茧，把事情整清楚。首先抛出三个大家关心的问题：校园招聘的秋招和春招有什么区别秋招零offer，春招还有机会吗秋招已经签约了，能去春招再看看吗春夏秋冬，四季变换，自有顺序。那为啥秋招会在春招之前呢？因为，对于学生来说，在校期间的求职时间有两段，一段是毕业前一年的秋天，在 7 月 ~ 11月之间，称为秋...

点赞评论收藏

分享

评论

2

10

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习没人带，苟住还是跑路？ #

17219次浏览 314人参与

# AI时代，哪些岗位最容易被淘汰 #

25665次浏览 218人参与

# 我们是不是被“优绩主义”绑架了？ #

12139次浏览 323人参与

# 秋招被确诊为…… #

280155次浏览 1587人参与

# 牛客2025仙途报告 #

48618次浏览 529人参与

# 每个月的工资都是怎么分配的？ #

81583次浏览 662人参与

# 字节出了豆包coding模型 #

8273次浏览 70人参与

# 对2025年忏悔 #

8128次浏览 154人参与

# 春招前还要继续实习吗？ #

10218次浏览 112人参与

# 为了秋招你都做了哪些准备？ #

30052次浏览 528人参与

# 离家近房租贵VS离家远但房租低，怎么选 #

14252次浏览 132人参与

# 2025秋招体验点评 #

86391次浏览 719人参与

# 非技术2024笔面经 #

452454次浏览 4920人参与

# 一人说一家双休的公司 #

11648次浏览 129人参与

# 牛友的国庆旅行碎片 #

26534次浏览 128人参与

# 我的第一个1024节 #

17152次浏览 251人参与

# 职场新人生存指南 #

492288次浏览 9518人参与

# 面试官问过你最刁钻的问题是什么？ #

13806次浏览 122人参与

# 工作后会跟朋友渐行渐远吗 #

54462次浏览 395人参与

# 毕业租房也有小确幸 #

152903次浏览 4533人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务