04-22 17:08 广西大学算法工程师发布于天津

关注

AI Agent常考面试题汇总- LoRA篇

1. 什么是 LoRA？

LoRA 全称是 Low-Rank Adaptation，核心思想是在微调大模型时不直接更新原始大权重矩阵，而是冻结预训练权重，只额外学习两个低秩矩阵，用这两个小矩阵的乘积去近似原权重的增量。

原来如果某层权重是：

W ∈ R^(d×k)

LoRA 不直接学习 ΔW 的完整矩阵，而是写成：

ΔW = B A
A ∈ R^(r×k), B ∈ R^(d×r), 且 r << min(d, k)

最终前向变成：

h = W x + ΔW x = W x + B A x

这样训练参数量会大幅下降。

2. LoRA 的思路是什么？

LoRA 的基本假设是：大模型在迁移到下游任务时，权重更新虽然看起来维度很高，但真正有效的更新空间往往是低秩的。也就是说，不需要对整个大矩阵做自由更新，只需要在一个低维子空间里学习变化，就足够适配任务。

所以它的思路就是：

冻结原模型参数
在指定线性层旁边插入低秩分支
只训练低秩矩阵
推理时可选择合并回原权重，也可以不合并

3. LoRA 的特点是什么？

LoRA 的主要特点有这些：

训练参数少，显存占用明显低于全参数微调
原模型参数冻结，训练更稳定
易于在多个任务之间切换，只需要切换 LoRA adapter
可以与量化结合，形成 QLoRA
推理时可以把 LoRA 权重合并进原模型，不额外增加推理结构复杂度

但它也有局限：

表达能力受 rank 限制
对某些复杂任务不一定能完全达到全参微调效果
插入位置、rank、alpha 对效果影响很大

4. 简单描述一下 LoRA

可以把 LoRA 理解成：不给大模型“动大手术”，只给它外挂一个很小的“修正模块”。

训练时不改原模型的大矩阵，只让这个修正模块学习任务相关的信息。这个修正模块本质上就是两个低秩矩阵，最后叠加到原线性层输出上。

5. QLoRA 的思路是怎么样的？

QLoRA 可以理解为：量化后的 LoRA 微调。它不是只做 LoRA，而是把基础模型先量化到 4bit，再在量化模型上挂 LoRA adapter 进行训练。

核心思路是：

预训练模型权重量化到 4bit，减少显存占用
前向和反向时通过反量化参与计算
冻结量化后的基础模型
只训练 LoRA 参数
配合分页优化器、NF4、Double Quantization 进一步省显存

所以 QLoRA 的关键不是“LoRA 更强”，而是“让大模型在单卡/小显存环境下也能微调”。

6. QLoRA 的特点是什么？

QLoRA 的特点一般会从下面几个方面说：

显存占用更低，可以在更小的 GPU 上训练更大的模型
基础模型是低比特存储，LoRA 参数仍然是可训练高精度参数
基本保留了 LoRA 的训练效率
通常采用 4bit NF4 量化，兼顾压缩率和效果
常用于 7B、13B、33B、65B 这类大模型的低成本微调

不过 QLoRA 的训练吞吐不一定比 LoRA 更快，因为量化/反量化本身也有额外开销，它主要优化的是显存，不一定总是优化时间。

7. AdaLoRA 的思路是怎么样的？

AdaLoRA 是在 LoRA 基础上做自适应 rank 分配。普通 LoRA 通常给所有层分配同样的 rank，但不同层对任务的重要性不一样，统一 rank 可能不够高效。

AdaLoRA 的核心思路是：

总预算固定
训练过程中动态评估各层的重要性
更重要的层分配更高 rank
不重要的层减少 rank
最终实现参数预算下更优的分配

也就是说，它不再默认“每层都一样重要”，而是让 rank 成为动态资源。

8. LoRA 权重是否可以合入原模型？

可以。LoRA 的增量是：

ΔW = B A

如果原权重是 W，那么合并后就是：

W' = W + ΔW

合并后推理时就不需要额外保留 LoRA 分支了，和普通全参模型一样直接前向。

优点是：

推理图更简单
部署更方便
不增加额外 forward 分支

缺点是：

合并后失去灵活切换多个 adapter 的能力
如果原模型是量化权重，合并操作需要注意精度和实现方式

9. ChatGLM-6B LoRA 后的权重多大？

这个问题没有固定唯一值，要看：

rank 取多少
注入哪些模块
是否只注入 attention
是否注入 MLP
保存的是纯 adapter 还是合并后的完整模型

一般来说，LoRA 只保存 adapter 权重时会远小于原模型，通常是几十 MB 到几百 MB 量级，而不是和原模型一样大。如果保存的是 merge 后完整模型，那大小接近原模型。

10. LoRA 微调优点是什么？

LoRA 的优点主要是：

参数效率高，只训练少量参数
显存占用低
训练成本低
适合多任务快速切换
不破坏原始模型参数
可以和量化、梯度检查点等技术结合

面试里常见一句话总结：

LoRA 用很小的可训练参数代价，换来了接近全参微调的效果。

11. L

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，总结的很好

点赞回复分享

发布于昨天 23:35 北京

04-22 15:23

南昌大学 Java

第一份实习简历

求拷打

程序员小白条：尽量别纯复制大家都一样的亮点部分，最好还是得有特点可以思考下优化和实验的量化具体效果

我的求职进度条

点赞评论收藏

04-21 21:49

字节跳动_研发工程师

零基础想要系统学习 Agent，千万别错过这两个开源项目！

2026年是 Agent 技术全面落地的一年，身边越来越多的小伙伴开始关注 Agent，想要系统学习，但却卡在了起点：   零基础：面对 AI 圈不断出现的新概念，不知道从哪开始下手；   无实战：看了一堆思维链、自我意识、驾驭工程等的概念，真写代码时还是一头雾水；   文档坑：优质项目多是英文文档，找不到成体系的国内教程。   在 GitHub 上搜 Agent，仓库成百上千，到底哪个才适合新手？别慌，项目贵精不贵多，今天给大家推荐两个 「适合中国宝宝体质」 的硬核开源项目。 一个帮你快速祛魅，看清 Agent 的极简本质；一个带你系统进阶，掌握完整的工程链路。 1. 入门：Learn Cl...

AI技术合集

点赞评论收藏

昨天 17:30

门头沟学院 Java

蔚来Agent平台开发面经分享 27实习

继续来分享下最近的面经~欢迎友好讨论，信息共享1. 你有没有接触过自动化测试？了解哪些测试框架（Python 或其他语言）？2. 你在A公司做的 AI 平台整体是干什么的？3. 你说的孤儿资源清理具体是怎么实现的？4. 你是怎么判断一个资源是孤儿资源的？5. 这个过程是基于全量扫描，还是事件驱动？具体怎么做的？6. Watch 和数据库同步这一套是怎么设计的？有没有一致性问题？7. 你的事件处理链路是怎样的？有没有用 Kafka？为什么用 / 不用？8. 你在B公司做的 Agent 核心是做什么的？解决了什么问题？9. 这个 Agent 实际是在部署什么？是服务、脚本还是其他东西？10. Agent 是中心化部署还是每台机器一个？为什么这么设计？11. Agent 和 Jenkins 的关系是什么？谁负责调度，谁负责执行？12. Agent 的所有动作是不是最终都是通过 Jenkins 来执行的？13. Jenkins 执行完之后，怎么和 Agent 做状态同步或结果回传？14. 既然 Jenkins 本身就能做自动化，为什么还要做一个 Agent？15. 用户在 Jenkins 上最容易填错哪些参数？为什么？16. 能不能完全不让用户填参数，让系统自动完成？为什么做不到？17. 如果 Jenkins 已经可以完成这些事情，引入 Agent / AI 的价值在哪里？18. 如果让你设计一个自动拉日志的 Agent，你整体流程是怎样的？19. 有3台Linux机器，日志路径不统一，而且是二进制日志，需要解析，你怎么设计？20. IP/Port 固定，但 SSH 密码会随软件版本变化，这个你怎么处理？21. 不同业务的人要不同日志路径，你怎么做管理？22. 用户不愿意维护配置表，你怎么让用户输入，同时系统自动沉淀规则？23. 日志解析涉及不同格式、工具、版本，这一块怎么设计？24. 如果这个 Agent 要扩展到自动检测、排障、自动化能力，架构怎么演进？25. 在完全没有规范流程、系统很混乱的情况下，你怎么落地这个 Agent？手撕：第二大的数字，不能用既有函数。

点赞评论收藏

04-22 15:54

苏州科技大学运营

上海市企业技术中心认定条件、流程、材料清单及好处

  上海市企业技术中心认定是强化企业创新主体地位、建设全球影响力科技创新中心的关键平台，聚焦集成电路、生物医药等先导与重点产业，是提升企业技术实力与产业能级的重要抓手。本文将详解申报条件、流程、材料清单及认定带来的政策支持与发展价值，助企业清晰路径、高效申报。华夏泰科深耕资质申报服务，精准解读官方政策、规范材料准备、把控关键节点，全程护航企业顺利通过认定，抢占创新发展先机。一、上海市企业技术中心认定条件  （一）指标要求  1.企业上一年度研究开发费用不低于1000万元，且占上一年度主营业务收入的比例不低于3%。研究开发费用占主营业务收入的比例为根据企业规模和参考行业系数计算后的值；  2.企...

点赞评论收藏

04-22 20:47

西安电子科技大学 Java

被学校发现实习被迫终止

友友们，本来在一个做自动驾驶的大厂实习，但因为长时间没刷宿舍门禁刷脸被导员发现，后面被拷问出来在实习后也是迫于压力离职了。但是我争取了一下，公司那边说是如果暑假还有hc的话我可以继续入职。但是只是口头承诺，我很焦虑到时候一句没有hc了就炸了（暑期目前只有一个小厂offer，四月才开始投，两个月生疏八股算法，感觉拿别的大厂暑期实习无望了）  友友们有什么建议吗？比如我要不要持续跟hr聊天来增加些好感度之类的？

牛客96065728...：导员还管不让实习吗，毕业月薪不够2w他来补吗

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 华泰星战营，提前锁定校招offer #

# 如果有时光机，你最想去到哪个年纪？ #