AI-Agent 面试题汇总 - 计算机视觉篇(目标检测)
1. 从 R-CNN 到 Faster R-CNN 的演变
- R-CNN:Selective Search 提候选框,逐框CNN提特征,慢。
- Fast R-CNN:整图卷积 + RoI Pooling,共享特征,速度提升。
- Faster R-CNN:引入 RPN 生成候选框,实现端到端 two-stage 检测。
2. 目标检测 two-stage 模型有哪些?
典型 two-stage:
- Faster R-CNN
- Mask R-CNN
- Cascade R-CNN特点:精度高,尤其对小目标和复杂场景更稳;但速度一般慢于 one-stage。
3. 说一下 NMS 的处理思想
NMS(非极大值抑制)用于去重框:按置信度排序,保留最高分框,删除与其 IoU 超阈值的重复框,迭代直到结束。目标是减少多重检测。
def nms(boxes, scores, iou_th=0.5):
idxs = scores.argsort(descending=True)
keep = []
while len(idxs) > 0:
i = idxs[0]
keep.append(i.item())
if len(idxs) == 1: break
ious = iou(boxes[i].unsqueeze(0), boxes[idxs[1:]]).squeeze(0)
idxs = idxs[1:][ious <= iou_th]
return keep
4. Soft-NMS 为什么可以提升检测效果?
Soft-NMS不直接删除重叠框,而是根据重叠程度衰减其分数,避免误删真正目标(尤其密集场景)。因此通常提升召回率与mAP。
5. 描述一下 IoU 的作用
IoU(Intersection over Union)衡量预测框和真实框重叠程度。用于:
- 正负样本分配
- NMS判定
- 评估指标(mAP@IoU阈值)
def iou_xyxy(a, b):
x1 = max(a[0], b[0]); y1 = max(a[1], b[1])
x2 = min(a[2], b[2]); y2 = min(a[3], b[3])
inter = max(0, x2-
剩余60%内容,订阅专栏后可继续查看/也可单篇购买
AI-Agent面试实战专栏 文章被收录于专栏
本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.