AI-Agent 面试题汇总 - Python数据分析篇

1. Python 数据分析常用库有哪些?各自作用是什么?

  • NumPy:高性能数值计算、矩阵运算
  • pandas:表格数据处理(DataFrame)
  • matplotlib / seaborn:可视化
  • scikit-learn:特征工程与机器学习工具
  • scipy:科学计算与统计函数

2. 什么是 Series 和 DataFrame?

  • Series:一维带索引数组
  • DataFrame:二维表格结构(行列索引),是分析工作主力数据结构。

3. 如何将字典创建为 DataFrame?(宝典同类高频)

import pandas as pd

data = {"name": ["Tom", "Bob"], "score": [88, 92]}
df = pd.DataFrame(data)
print(df)

4. 如何查看 DataFrame 的基本信息?

df.head()
df.tail()
df.shape
df.info()
df.describe()

5. 如何输出 df 的所有列名?

print(df.columns)
# 或
print(df.columns.tolist())

6. 如何修改第二列列名为 popularity?

cols = df.columns.tolist()
cols[1] = "popularity"
df.columns = cols

7. 如何筛选包含 "Python" 的行?

result = df[df["content"].str.contains("Python", na=False)]

8. 如何统计 grammar 列每种语言出现次数?

df["grammar"].value_counts()

9. loc 和 iloc 的区别是什么?

  • loc:按标签取值
  • iloc:按位置下标取值

10. 如何新增一列并按条件赋值?

df["level"] = "low"
df.loc[df["score"] >= 90, "level"] = "high"

11. apply、map、applymap 区别?

  • map:Series 元素级映射
  • apply:按行/列应用函数
  • applymap:DataFrame 每个元素应用函数(新版常建议用 map/向量化替代)

12. 什么是向量化操作?为什么重要?

向量化是直接对整列/数组运算,避免 Python for 循环,速度更快、代码更简洁。

13. 如何处理缺失值(NaN)?

df.isna().sum()
df.dropna()
df.fillna(0)
df["age"] = df["age"].fillna(df["age"].median())

14. 缺失值填充常见策略有哪些?

  • 数值:均值/中位数/分组统计填充
  • 类别:众数/“unknown”
  • 时间序列:前向填充、后向填充

15. 如何删除重复值?

df.drop_duplicates()
df.drop_duplicates(subset=["user_id"], keep="last")

16. groupby 的核心作用是

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

AI-Agent面试实战专栏 文章被收录于专栏

本专栏聚焦 AI-Agent 面试高频考点,内容来自真实面试与项目实践。系统覆盖大模型基础、Prompt工程、RAG、Agent架构、工具调用、多Agent协作、记忆机制、评测、安全与部署优化等核心模块。以“原理+场景+实战”为主线,提供高频题解析、标准答题思路与工程落地方法,帮助你高效查漏补缺.

全部评论
mark
点赞 回复 分享
发布于 03-10 23:39 河北
大佬 大佬 怎么区分是幻觉还是数据泄露啊 感觉 表现的好像哦
点赞 回复 分享
发布于 03-10 21:57 黑龙江

相关推荐

评论
5
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务