03-09 15:15 广西大学算法工程师发布于河北

关注

AI-Agent 面试题汇总 - 机器学习篇

1. 机器学习中特征的理解

特征（Feature）是样本可量化的属性，是模型输入。特征质量通常决定模型效果上限。常见有数值、类别、文本、时间、统计聚合、交叉特征等。

2. 机器学习中有哪些特征工程方法？

常见方法：缺失值处理、异常值处理、编码、标准化/归一化、特征构造、特征选择、降维。

from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.linear_model import LogisticRegression

num_cols = ["age", "salary"]
cat_cols = ["city", "edu"]

preprocess = ColumnTransformer([
    ("num", Pipeline([
        ("imputer", SimpleImputer(strategy="median")),
        ("scaler", StandardScaler())
    ]), num_cols),
    ("cat", Pipeline([
        ("imputer", SimpleImputer(strategy="most_frequent")),
        ("onehot", OneHotEncoder(handle_unknown="ignore"))
    ]), cat_cols)
])

clf = Pipeline([
    ("prep", preprocess),
    ("model", LogisticRegression(max_iter=200))
])

3. 机器学习中的正负样本

二分类中目标类一般记为正样本（1），非目标类为负样本（0）。当类别不平衡时，常用重采样、类别权重、阈值调优、PR-AUC等方式处理。

4. 线性分类器与非线性分类器的区别及优劣

线性分类器决策边界是超平面，训练快、可解释性好；非线性分类器表达能力强，可拟合复杂边界，但更易过拟合、调参成本更高。

5. 如何解决过拟合问题

可通过增加数据、正则化、降低模型复杂度、交叉验证、早停、集成学习等方式缓解过拟合。

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(
    n_estimators=300,
    max_depth=8,
    min_samples_leaf=5,
    random_state=42
)
scores = cross_val_score(model, X, y, cv=5, scoring="f1")
print(scores.mean())

6. L1 和 L2 正则的区别，如何选择 L1 和 L2 正则

L1 倾向产生稀疏解（可做特征选择）；L2 倾向让参数整体变小（更稳定）。高维稀疏场景可优先尝试 L1，通用场景常先试 L2。

from sklearn.linear_model import LogisticRegression

l1_model = LogisticRegression(penalty="l1", solver="liblinear", C=1.0)
l2_model = LogisticRegression(penalty="l2", solver="liblinear", C=1.0)

7. 有监督学习和无监督学习的区别

有监督学习有标签（分类/回归）；无监督学习无标签（聚类/降维/异常检测）。

8. 有

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点，内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线，提供高频题解析、标准答题思路与工程落地方法，帮助你高效查漏补缺.

全部评论

推荐最新楼层

代码练习生_code

门头沟学院 C++

很强啊大佬面了多少家

点赞回复分享

发布于 03-10 23:02 河北

在迎接offer的牛可乐很想潜水

太及时了

点赞回复分享

发布于 03-10 22:17 云南

再晒一会鱼

国家开放大学前端工程师

感谢分享所以现在算法主要是使用Adam吗？

点赞回复分享

发布于 03-10 21:46 黑龙江

03-23 15:54

已编辑

门头沟学院算法工程师

Adam 原理 计算公式auc 横纵坐标二叉树公共父结点mmoe 专家网络 塌陷情况 怎么解决mmoe 门控 计算公式mmoe 训练时遇到的困难强化学习的原理qwen3 原理ctcvr怎么计算，直接计算，还是ctr*cvr代码：二叉树最近公共父节点

查看11道真题和解析

点赞评论收藏

分享

04-15 15:40

门头沟学院算法工程师

飞猪agent开发实习一面分享 50m

攒人品中，祝大家都能拿到满意的Offer！1.实习拷打2.重写Java对象hashcode()和equals()的原理?3.介绍一下Java的异常体系?平时编码的时候遇到的常见异常?4.介绍一下reentrantlock。5.实际应用过reentrantlock吗?介绍具体的应用场景?6.volatile关键字的作用?为什么能保证可见性和有序性?为什么不能保证原子性?7.解释一下threadlocal的使用场景和内存泄漏问题?8.平时用什么大模型?9.后端代码用大模型写的话，完成率是多少，有什么使用心得?10.介绍agent项目，遇到的问题，担任的角色，如何衡量项目做的怎么样?项目上线后，可能会进行功能维护和升级，具体应该怎么做?11.对于新的AI技术，你是怎么学习的，学习的路径?12.你说项目中带了另外两个低年级学生做，当产生分歧的时候，你是怎么解决的?

查看11道真题和解析

点赞评论收藏

分享

03-14 09:57

广西大学算法工程师

度小满大模型开发一面

1、知道 GPT 和 BERT 这种模型的基础框架是怎样的吗BERT 和 GPT 都是基于 Transformer 的预训练模型，但结构和任务目标不一样。BERT 一般采用 Transformer Encoder 堆叠起来的双向编码结构，在预训练时主要做 MLM，也就是随机遮盖一部分 token，让模型根据上下文去恢复被遮掉的词，因此它更适合理解类任务，比如分类、匹配、抽取、检索表示学习。GPT 采用 Transformer Decoder 堆叠起来的单向自回归结构，在预训练时做 next token prediction，也就是根据前面的 token 预测下一个 token，因此它更适合生成...

AI-Agent面试实战...

点赞评论收藏

分享

03-27 13:50

东北大学 C++

分享我的Agent学习路线

我本身的主力编程语言就是Python，再加上导师的研究方向刚好是机器学习、深度学习，这方面的基础也就自然而然积累了一些。后来也是误打误撞，进入了AI Agent开发相关的岗位实习，整个过程也算实打实的干中学、边做边练。刚接触这块的时候，我最先做的就是梳理Agent的主流开发框架、完整运行流程，先把整体体系摸清楚。等对各类框架有了基础认知后，我就开始往深钻研，吃透每个模块底层的代码逻辑：一边在GitHub上研读优质的开源项目代码，一边仔细扒LangChain官网，把里面的各项功能都研究明白，在这里也特别感谢我的小导豆包老师，帮了我不少忙。把整体框架和流程吃透之后，我就开始深耕各个核心模块，比如深挖RAG模块里的文本分块方式、Embedding实现逻辑、检索增强的实现原理，以及各类优化策略等等，一点点把细节摸透。但这个时候也真的忍不住感叹，AI行业的技术迭代速度实在太快了，我刚把一套技术技能学扎实，Claw Bot也就是现在的龙虾模型就推出了，还是得持续跟进、不停学习。平时也有不少朋友问我，有没有推荐的学习老师或者教程。其实我就是典型的电子蝗虫学习法，不管来源是什么，只要是自己需要的知识点、技术内容，就针对性去看去学，完全按需学习。总而言之，AI行业更新迭代的速度太快了，想要跟上节奏就必须保持持续学习的状态，有时候甚至还要及时跟进顶会论文，才能不落后。以上就是我这段时间的完整学习路径啦，也希望评论区的各位大佬多多指点、不吝赐教。

从事AI岗需要掌握哪些技...

点赞评论收藏

分享

03-12 10:01

广西大学算法工程师

AI-Agent 面试题汇总 - 大模型微调面

1. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？这个问题不能只看模型参数量，还得把训练时真正占显存的几部分一起算进去。全参数微调时，显存通常会被下面这些东西吃掉：模型参数本身梯度优化器状态前向传播保存的激活值CUDA 运行时和框架缓存如果用的是 AdamW 这类优化器，除了参数之外，还要额外维护一阶矩和二阶矩，所以训练显存会明显高于推理显存。一个比较粗糙但实用的经验是：全参数微调的显存，往往是模型权重显存的 6 到 12 倍左右，具体还得看序列长度、batch size、是否开 gradient checkpointing、是否做 ZeRO/FSDP 分片。拿 7B 模型举例，F...

AI-Agent面试实战...

点赞评论收藏

分享

评论

4

6

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 简历上如何体现你的“AI”能力？ #

11643次浏览 269人参与

# 正在春招的你，也参与了去年秋招吗？ #

397533次浏览 2736人参与

# 华泰星战营，提前锁定校招offer #

12566次浏览 382人参与

# 哪些AI项目值得做？ #

21533次浏览 532人参与

# 实习要如何选择和准备？ #

157831次浏览 1584人参与

# 找不到大厂实习可以去小厂吗？ #

16916次浏览 193人参与

# 虾皮求职进展汇总 #

402110次浏览 2867人参与

# 你总挂在第__面？ #

8226次浏览 91人参与

# 非技术岗薪资爆料 #

529108次浏览 3095人参与

# 实习时最怕听到的一句话 #

18975次浏览 173人参与

# 没有面试的日子里，你在做什么 #

10936次浏览 324人参与

# 你简历上最心虚的一句话 #

17652次浏览 212人参与

# 90后北漂现状 #

38983次浏览 225人参与

# 京东笔试 #

172265次浏览 935人参与

# 你知道最慷慨和最抠的公司分别是 #

9127次浏览 73人参与

# 25届嵌入式真的回暖了吗 #

52447次浏览 385人参与

# 父母对你找工作是助力还是阻力？ #

46222次浏览 405人参与

# 非技术投递记录 #

726781次浏览 6948人参与

# 刚入职就____，这样正常吗？ #

141321次浏览 685人参与

# 拼多多工作体验 #

57781次浏览 418人参与

# 参加哪些竞赛对找工作有帮助？ #

47651次浏览 250人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务