今天 08:54 广西大学算法工程师发布于天津

关注

作业帮大模型算法开发二面

1. 大模型微调的完整技术方案与工程落地细节

采用 LoRA 参数高效微调方案，仅对 Transformer 的 Q/V 投影层添加低秩矩阵，冻结底座模型参数。训练时设置秩 r=8、缩放因子 α=16，使用 AdamW 优化器，学习率 2e-4，配合余弦退火学习率调度与梯度裁剪。工程上使用混合精度训练、分布式数据并行，提升训练效率，训练后合并 LoRA 权重，不增加推理延迟。

import torch
import torch.nn as nn

class LoRALinear(nn.Module):def __init__(self, in_features, out_features, r=8, alpha=16):super().__init__()
        self.weight = nn.Parameter(torch.randn(out_features, in_features), requires_grad=False)
        self.A = nn.Parameter(torch.randn(r, in_features) * 0.01)
        self.B = nn.Parameter(torch.randn(out_features, r) * 0.01)
        self.scale = alpha / r

    def forward(self, x):return x @ self.weight.t() + ((x @ self.A.t()) @ self.B.t()) * self.scale

2 大模型业务指标体系设计与召回率的定义

核心指标覆盖效果、效率、安全三大维度：效果指标包括准确率、召回率、F1、幻觉率；效率指标包括推理延迟、吞吐量、显存占用；安全指标包括合规率、有害内容拦截率。召回率定义为模型正确识别的正样本数与真实正样本总数的比值，用于衡量模型对正样本的覆盖能力。

3. 大模型幻觉问题的全链路解决方案

从数据、训练、推理、后处理四个环节闭环解决：数据层面构建高质量领域知识库，清洗噪声数据；训练层面通过 SFT+RLHF 微调对齐业务需求；推理层面引入 RAG 检索增强约束生成逻辑；后处理层面添加事实校验模块，拦截错误信息并结合知识图谱保证一致性。

4. 多头注意力机制的核心实现与数学原理

多头注意力将输入特征通过线性变换投影到多个子空间，分别计算自注意力后拼接，再通过线性变换输出。核心公式为：MultiHead(Q,K,V)=Concat(head1,...,headh)WO实现时将 Q/K/V 按头数切分并行计算，提升模型并行度与特征表达能力，捕捉多维度语义关联。

5. RoPE 旋转位置编码的核心原理与长序列优势

RoPE 通过旋转矩阵将绝对位置信息注入 Q/K 向量，同时保留相对位置关系，特征内积仅与相对位置相关。长序列优势为无序列长度依赖、可外推至更长文本，有效解决传统位置编码长序列性能衰减问题。

6. MoE 架构在大模型中的核心设计与训练难点

MoE 通过激活部分专家网络处理输入，在提升模型容量的同时降低计算量。训练难点包括专家负载均衡、梯度通信开销、门控网络精度优化，需结合辅助损失与动态路由策略保证训练稳定性。

7. vLLM 中 PagedAttention 的显存优化逻辑

将 KV 缓存划分为固定大小页面，支持非连续显存分配与动态调度，彻底消除显存碎片，配合连续批处理机制大幅提升显存利用率与推理吞吐量，适配高并发大模型服务。

8. 大模型训练中 Loss 突刺的成因与工程处理方案

Loss 突刺主要来源于异常样本、数据分布突变、梯度爆炸、学习率配置不当与硬件通信异常。解决方

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

04-10 11:37

黑河学院运营

初筛根本过不了。。。

点赞评论收藏

分享

04-11 21:48

门头沟学院 C++

双非28，一段实习，被人举报

刚实习了两周，被导员一通电话打过来可能会给处分学校这里坚决是不允许大二大三实习，只有大四后半学期才允许😂不知道被谁举报的，总之回来领导跟我说了一大堆，说在学校呆着能学到知识以外的东西。然后一门课也是被重修了，感觉好不容易实个习，一波三折的。最后还是选择了不回头，总觉得，人这一生就这一次，要尽力去活才算圆满。

爱睡觉的冰箱哥：不用根他们bb太多，回来待两天刷刷脸，然后继续实习就行了

，反正又不能开除你

你找实习最大的坎坷是什么

点赞评论收藏

分享

今天 08:54

广西大学算法工程师

作业帮大模型算法开发一面

1. 自我介绍2. RAG系统的核心架构、检索优化与在教育场景的落地难点RAG核心架构分为数据预处理、检索模块、提示工程、大模型生成、后处理校验五部分。检索优化包括混合检索、多轮检索、知识切片、向量库优化等。在教育场景的落地难点在于知识专业性强、知识点关联复杂，易出现检索不精准；题目、公式、图表等多模态数据的结构化提取难度大；学生提问口语化、歧义多，意图理解难度高；需严格保证知识准确性，避免大模型幻觉。解决方案包括构建教育领域专属知识库、多模态文档解析、意图识别优化、事实校验机制等。3. SFT的核心流程、数据构造要点与在教育大模型中的应用SFT核心流程为数据准备、模型选择、微调策略、训练配置...

AI-Agent面试实战...

点赞评论收藏

分享

04-10 17:55

重庆大学 Java

暑期意外的结束了

美团timeline一面 3.26二面 4.2oc 4.8offer 4.10其他：oppo 一面挂vivo 没动静携程 笔试挂哔哩哔哩 没动静感想感觉找实习运气也占不少的成分，本来0实习选手暑期只是准备随便投一下练一练，想着过会儿再找日常实习，没想到美团直接收留我了。感谢一面面试官，在我第一次面大厂的时候给了我自信

ZQFbest：感觉美团一堆KPI

点赞评论收藏

分享

昨天 15:46

兰州财经大学 Java

我简历不合适吗，改很多次了

一开始还有一些小厂中厂找我，现在啥都没有了

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的求职进度条 #

987398次浏览 6550人参与

# 实习教会我的事 #

73587次浏览 507人参与

# 厦门银行科技岗值不值得投 #

19014次浏览 422人参与

# 哪些公司一直卡在简历筛选 #

106247次浏览 363人参与

# 我想象的实习vs现实的实习 #

332907次浏览 2298人参与

# Agent面试会问什么？ #

39548次浏览 1437人参与

# 米哈游笔试 #

656060次浏览 1160人参与

# 一人分享一个skill #

10310次浏览 243人参与

# 总结:哪家公司最喜欢泡池子 #

168048次浏览 571人参与

# 拿到offer之后，可以做些什么 #

104972次浏览 511人参与

# 春招至今，你收到几个面试了？ #

105804次浏览 1297人参与

# 说说你知道的学历厂 #

401999次浏览 1434人参与

# 米哈游工作体验 #

29964次浏览 145人参与

# 我是XXX，请攻击我最薄弱的地方 #

73536次浏览 499人参与

# 今年春招是金一银二嘛？ #

99739次浏览 560人参与

# 帆软软件工作体验 #

18228次浏览 128人参与

# 拼多多工作体验 #

55431次浏览 389人参与

# 面试体验最好和最差的公司 #

25911次浏览 173人参与

# 中国电信笔试 #

40850次浏览 399人参与

# 通信/硬件的薪资开多少，才值得去？ #

76845次浏览 408人参与

# 国企秋招，你投了吗？ #

72053次浏览 424人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务