八股随笔
深度学习算法工程师,cpp开发工程师,agent开发工程师面试经验
深度学习八股
一、深度学习八股
1. 什么是过拟合?怎么解决
训练集效果远远大于测试集,启用L1,L2正则化,提高dropout率,批次归一化等等
2. 什么是欠拟合?怎么解决
训练集和测试集效果均不好,减少dropout率,通过注意力机制增驾网络复杂度
3. 梯度消失和梯度爆炸原因是什么?
非线性激活函数导致梯度上升和下降,例如relu可能导致梯度消失等等
4. RELU和sigmoid的是什么?
明确两者的表达式
5. 什么是反向传播,介绍一下梯度反向传播
数据流正向传播,为了让目标变小,最终函数对网络参数求导Δw,为了减少目标函数w=w-Δw
6. 什么是损失函数?分类和分割常用那些?
为了帮助我们达到我们的目标。分类准确率,分割常用损失交叉熵
7. 分类任务和分割任务你认为区别在哪里?
解码器的最后部分不同,分割本质是像素级别的分类。分类是泛泛整体的分割
8. dropout原理是什么?有什么用
一定比例神经元失活
9. 卷积层的作用是什么
提取感受野范围内特征
10. 池化层的作用是什么?什么是平均值池化,什么是最大值池化
根据感受野内内容进一步提取特征,求感受野平均值,最大值
11. 什么是注意力机制?注意力机制有什么用?
帮助我们捕获需要关注的特征,忽略次要特征
12. 你的注意力机制如何设计的?
并行融合通道注意力机制和空间注意力机制
13. 残差网络好,为什么要利用残差网络?残差网络作用
融合浅层特征,避免梯度消失,梯度爆炸
14. 什么是连通性?单连通和多连通分别是什么
闭合曲线就是连通的,中间部位有无其他区域被分为单联通和多连通
15. 训练神经网络的时候,如何选择学习率
初始学习率较高,进行后学习率降低。加速收敛,寻找最优值
16. 一个深度学习的分割项目都包括那些环节?
数据集预处理,神经网络搭建,损失函数,评价指标选择,后处理
17. 各个环节都有什么用途
预处理,进行数据增强,提高网络鲁棒性
神经网络,提取归纳特征完成任务
损失函数,确定任务目标
评价指标,评价模型好坏
后处理,进一步处理,提高评价指标
18.什么是Unet网络?
u型网络,结果包括编码器解码器,编码器不断卷积池化进行特征提取,解码器不断接受跳跃连接和上采样,卷积进行解码
19. 损失函数是什么,如何设计的
bce和dice表达式,如何联合
20. 常见的后处理操作如何设计
根据数据集特点,单连通区域,几个目标,目标间的关系等等
21. L1和L2正则化有什么用
l1,l2公式明确,减少参数复杂题,防止过拟合,
22. 如何评估模型结果的好坏
通过评价指标的高低来评价模型的好坏
23. 什么是准确率
tp+tn/(tp+tn+fn+tn)
24. 什么是精确率
所有预测为真当中真的为真的概率: tp/(tp+fp)
25. 什么是召回率
所有真当中预测为真概率: tp/(tp+fn)
26. 什么是混淆矩阵
真实为真,真实为假
预测为真: tp,fp
预测为假: fn,tn
27. 一般如何进行数据增强
旋转,平移,镜像,随机裁剪等变换
其他
1. 你认为你的项目都用到了什么?
残差网络,混合注意力机制,混合损失函数,后处理设计
2. 你认为你用的这些模块有什么用?
残差网络: 融合浅层特征,避免梯度消失或者爆炸
混合注意力机制:让我们更加关注值得关注的特征,忽略次要特征
混合损失函数:联合dice+iou,对于正类分割效果加强
后处理:找到数据集的特点,针对数据集的特点进行设计,利用连通性(单、多),大小,主次要病灶等手段
3. 你用了什么评价指标?
iou,dice,精确率,召回率,准确率
4. 你的效果大概提升了多少?
自己实际情况
cpp开发八股
cpp基础
1. malloc与new区别
返回值有无类型
2.cpp的特点
封装继承多态
封装类
子类继承父类,public,private,protect不同类型
3.指针悬空 内存泄露
指针释放,内容没有释放,空间消失,指针还在
4.智能指针
自定取消指针
5.分区——内存分区
四分区模型
计算机网络
6. udp/tcp划分
安全与快速性 握手与挥手
7. 7层模型
物理层,数据链路层……
8. http信号
http和https区别
数据结构
9. 线性结构,非线性结构
链表,线性表,堆栈,队伍
树,图
10. dfs,bfs 树图
递归算法
11. 递归,stack
处理括号匹配
数据库相关知识
agent开发
1. agent都有什么类型
reflect,reaction,plan-action等等
2. agent组成
llm,prompt,momery,tool
3.开发框架
langgraph(非可视化),dify(可视化)
4. prompt组成
系统prompt+用户+记忆
5. langgraph
数据状态在图之间流动
6. 如何设计并发
通过时间循环执行异步函数实现并发
7. Python后端框架
Flask,djingo
8. 前端框架
vue,html,JavaScript
9.如何管理记忆
短期记忆,长期记忆
10.如何进行rag,数据增强
余弦相似度匹配,向量匹配
11.如何微调模型
SFT+RL
如何设计的项目
1. 分为七段式提取pdf内容指定内容,内容需求分类,保存数据库,与已有内容对比去重
设计文本粗分块,文本细分块
2. 如何设计agent,mcp链接langchain,mcp链接dify,链接飞书机器人
3.lora微调大模型针对特定分类任务,
4.搭建串级模型,微调大模型+通过大模型prompt
手撕,括号匹配,单词接龙,链表,冒泡,快排,图,动态规划
深度学习八股
一、深度学习八股
1. 什么是过拟合?怎么解决
训练集效果远远大于测试集,启用L1,L2正则化,提高dropout率,批次归一化等等
2. 什么是欠拟合?怎么解决
训练集和测试集效果均不好,减少dropout率,通过注意力机制增驾网络复杂度
3. 梯度消失和梯度爆炸原因是什么?
非线性激活函数导致梯度上升和下降,例如relu可能导致梯度消失等等
4. RELU和sigmoid的是什么?
明确两者的表达式
5. 什么是反向传播,介绍一下梯度反向传播
数据流正向传播,为了让目标变小,最终函数对网络参数求导Δw,为了减少目标函数w=w-Δw
6. 什么是损失函数?分类和分割常用那些?
为了帮助我们达到我们的目标。分类准确率,分割常用损失交叉熵
7. 分类任务和分割任务你认为区别在哪里?
解码器的最后部分不同,分割本质是像素级别的分类。分类是泛泛整体的分割
8. dropout原理是什么?有什么用
一定比例神经元失活
9. 卷积层的作用是什么
提取感受野范围内特征
10. 池化层的作用是什么?什么是平均值池化,什么是最大值池化
根据感受野内内容进一步提取特征,求感受野平均值,最大值
11. 什么是注意力机制?注意力机制有什么用?
帮助我们捕获需要关注的特征,忽略次要特征
12. 你的注意力机制如何设计的?
并行融合通道注意力机制和空间注意力机制
13. 残差网络好,为什么要利用残差网络?残差网络作用
融合浅层特征,避免梯度消失,梯度爆炸
14. 什么是连通性?单连通和多连通分别是什么
闭合曲线就是连通的,中间部位有无其他区域被分为单联通和多连通
15. 训练神经网络的时候,如何选择学习率
初始学习率较高,进行后学习率降低。加速收敛,寻找最优值
16. 一个深度学习的分割项目都包括那些环节?
数据集预处理,神经网络搭建,损失函数,评价指标选择,后处理
17. 各个环节都有什么用途
预处理,进行数据增强,提高网络鲁棒性
神经网络,提取归纳特征完成任务
损失函数,确定任务目标
评价指标,评价模型好坏
后处理,进一步处理,提高评价指标
18.什么是Unet网络?
u型网络,结果包括编码器解码器,编码器不断卷积池化进行特征提取,解码器不断接受跳跃连接和上采样,卷积进行解码
19. 损失函数是什么,如何设计的
bce和dice表达式,如何联合
20. 常见的后处理操作如何设计
根据数据集特点,单连通区域,几个目标,目标间的关系等等
21. L1和L2正则化有什么用
l1,l2公式明确,减少参数复杂题,防止过拟合,
22. 如何评估模型结果的好坏
通过评价指标的高低来评价模型的好坏
23. 什么是准确率
tp+tn/(tp+tn+fn+tn)
24. 什么是精确率
所有预测为真当中真的为真的概率: tp/(tp+fp)
25. 什么是召回率
所有真当中预测为真概率: tp/(tp+fn)
26. 什么是混淆矩阵
真实为真,真实为假
预测为真: tp,fp
预测为假: fn,tn
27. 一般如何进行数据增强
旋转,平移,镜像,随机裁剪等变换
其他
1. 你认为你的项目都用到了什么?
残差网络,混合注意力机制,混合损失函数,后处理设计
2. 你认为你用的这些模块有什么用?
残差网络: 融合浅层特征,避免梯度消失或者爆炸
混合注意力机制:让我们更加关注值得关注的特征,忽略次要特征
混合损失函数:联合dice+iou,对于正类分割效果加强
后处理:找到数据集的特点,针对数据集的特点进行设计,利用连通性(单、多),大小,主次要病灶等手段
3. 你用了什么评价指标?
iou,dice,精确率,召回率,准确率
4. 你的效果大概提升了多少?
自己实际情况
cpp开发八股
cpp基础
1. malloc与new区别
返回值有无类型
2.cpp的特点
封装继承多态
封装类
子类继承父类,public,private,protect不同类型
3.指针悬空 内存泄露
指针释放,内容没有释放,空间消失,指针还在
4.智能指针
自定取消指针
5.分区——内存分区
四分区模型
计算机网络
6. udp/tcp划分
安全与快速性 握手与挥手
7. 7层模型
物理层,数据链路层……
8. http信号
http和https区别
数据结构
9. 线性结构,非线性结构
链表,线性表,堆栈,队伍
树,图
10. dfs,bfs 树图
递归算法
11. 递归,stack
处理括号匹配
数据库相关知识
agent开发
1. agent都有什么类型
reflect,reaction,plan-action等等
2. agent组成
llm,prompt,momery,tool
3.开发框架
langgraph(非可视化),dify(可视化)
4. prompt组成
系统prompt+用户+记忆
5. langgraph
数据状态在图之间流动
6. 如何设计并发
通过时间循环执行异步函数实现并发
7. Python后端框架
Flask,djingo
8. 前端框架
vue,html,JavaScript
9.如何管理记忆
短期记忆,长期记忆
10.如何进行rag,数据增强
余弦相似度匹配,向量匹配
11.如何微调模型
SFT+RL
如何设计的项目
1. 分为七段式提取pdf内容指定内容,内容需求分类,保存数据库,与已有内容对比去重
设计文本粗分块,文本细分块
2. 如何设计agent,mcp链接langchain,mcp链接dify,链接飞书机器人
3.lora微调大模型针对特定分类任务,
4.搭建串级模型,微调大模型+通过大模型prompt
手撕,括号匹配,单词接龙,链表,冒泡,快排,图,动态规划
全部评论
相关推荐

查看1道真题和解析