10-10 19:42 华中科技大学数据分析师发布于湖北

关注

小厂数分实习笔试

第一次笔试，我非常垃圾，涉及Pandas和python
1、数据去重： “按 X 去重，保留 ID 最大的”
按照x排列
df_sorted=df.sort_values(by='x')
# 按x分组，取id最大值
result=df_sorted.groupby('x')['id'].max().reset_index()
print(result)
2、计算每个种类的违约率
import pandas as pd
# 构造数据（根据手写内容，假设 class 和 tar 的对应关系如下）
data = {
    "class": ["D", "B", "D", "C", "C", "A", "C", "D", "A", "B", "D", "A", "C", "A", "C"],
    "tar": [0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1]
}
df = pd.DataFrame(data)
# 按 class 分组，计算违约率（tar==1 的比例）
default_rates = df.groupby("class")["tar"].mean()
print(default_rates)
3、求函数fx=e^x+x^2在何处取得最小值，精度要求：绝对误差小于1e-6，不能调用优化相关包
import math

# 定义一阶导数 f'(x) = e^x + 2x
def f_prime(x):
    return math.exp(x) + 2 * x

# 定义二阶导数 f''(x) = e^x + 2
def f_double_prime(x):
    return math.exp(x) + 2

# 牛顿迭代法找极值点
def newton_method(initial_x, epsilon=1e-6):
    x = initial_x
    while True:
        x_next = x - f_prime(x) / f_double_prime(x)
        # 检查绝对误差是否小于精度要求
        if abs(x_next - x) < epsilon:
            return x_next
        x = x_next

# 初始值选择（通过观察函数趋势，选 x=0 附近作为初始值）
initial_x = 0
min_x = newton_method(initial_x)
min_value = math.exp(min_x) + min_x ** 2

print(f"函数 f(x) = e^x + x^2 在 x = {min_x:.8f} 处取得最小值")
print(f"最小值为: {min_value:.8f}")
4、写个month_diff函数。计算两个'ym'格式的日期字符串的月份差
from datetime import datetime

def month_diff(ym1, ym2):
    # 解析日期为年和月
    y1, m1 = int(ym1[:4]), int(ym1[4:])
    y2, m2 = int(ym2[:4]), int(ym2[4:])
    # 计算总月份差
    return (y1 - y2) * 12 + (m1 - m2)

# 验证示例
print(month_diff('202001', '201804'))  # 输出：21
5、解析字符串：s='A1:1;b2:13;x5:651;D61:47' 解析为字典格式
s = 'A1:1;b2:13;x5:651;D61:47'
# 先按分号 ; 分割成多个键值对字符串
items = s.split(';')
result_dict = {}
for item in items:
    # 再按冒号 : 分割成键和值
    key, value = item.split(':')
    # 将值转换为整数（根据需求，也可保留字符串）
    result_dict[key] = int(value)
print(result_dict)

全部评论

推荐最新楼层

牛客596424213号

西藏大学数据分析师

我也不太会写友友，继续加油吧

点赞回复分享

发布于昨天 13:58 坦桑尼亚

楼主

华中科技大学数据分析师

一个也不会写，不知道是国庆疯玩之后全部忘了还是压根就不会，不过pandas确实一直不怎么能自主用，很多都是查ai

点赞回复分享

发布于 10-10 19:44 湖北

不愿透露姓名的神秘牛友

09-23 20:04

字节秋招痛苦三面

1. k-means聚类点初始化阶段有什么优化策略？2. 如何评估聚类的好坏？3. 介绍transformer架构？4. Attention计算时间复杂度？5. 超长序列下降低Attention时间复杂度的方法？6. Transformer用的什么Norm？7. 分类模型的指标有哪些？8. 分类模型的损失函数？交叉熵损失相比于均方差损失的优势？9. 模型训练过程中哪些行为可能导致梯度爆炸？10. 手撕 树的最长链长度 面的实在有点痛苦，主包做的大模型方向，确实对过去的分类模型不是很了解，问的东西也没什么答出来的，大模型相关的八股也没问，简历上的东西也不问，应该是业务原因吧，可能用大模型不多所以...

查看10道真题和解析

点赞评论收藏

分享

09-23 10:30

已编辑

华中科技大学数据分析师

27届数分找第一段实习

求简历痛批🤓     

实习，投递多份简历没人回...

点赞评论收藏

分享

09-27 12:07

门头沟学院算法工程师

中金所数据-数据研发笔试

1. 30道单选题（60分），主要涵盖期货互换、期权、概率论计算、泊松定理、期货基础知识较多 2. 2道简答题（20分），（1）. 欧式期权的定价变量因素，和变量对定价的影响分析。（2）. CAPM原理解释和实际应用、 3. 2道编程题, 一道sql一道编程，难度都较简单3.2道编程题（20分），一道sql，一道编程，难度都较简单

投递中金所技术公司等公司10个岗位

点赞评论收藏

分享

昨天 14:39

西安电子科技大学算法工程师

荣耀-大模型算法工程师-一面

1.自我介绍 2.简历问答 3.反问

荣耀一面285人在聊

点赞评论收藏

分享

09-21 22:52

杭州电子科技大学大数据开发工程师

某手+用户数仓岗位数仓实习面试题

1.数仓的概念2.业务域怎么分的？3.关于主题的说法，如何划分？4.ADS的表如何分类，提交什么需求就叫什么表？5. 数仓分层建设中，DWD、DWS、ADS哪一层最难？经典问题争议：数仓分层建设中，DWD、DWS、ADS哪一层最难？6.各层有多少张表，数据量？7. 刚提到的数据资产建设，数据资产主要是放在那一层产出的？这块是怎么做的？8.数仓跑了多久9.hadoop的基本原理。hadoop3跑的啥，tez还是spark？10.RDD的基本原理，弹性怎么理解11.宽依赖和窄依赖12.spark数据倾斜的问题13.结果表： 客服名称，客户数 ,未完成对话数， 平均响应时间

查看12道真题和解析

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 找工作中的小确幸 #

5320次浏览 60人参与

# 实习在多还是在精 #

1292次浏览 28人参与

# 深信服秋招来了 #

280289次浏览 2917人参与

# 面包vs爱情，怎么选？ #

14535次浏览 161人参与

# 秋招踩过的“雷”，希望你别再踩 #

10101次浏览 84人参与

# 发面经攒人品 #

2315803次浏览 32292人参与

# 爱玛科技集团求职进展汇总 #

29195次浏览 205人参与

# 实习下班不想学习，正常吗？ #

1731次浏览 26人参与

# 机械求职避坑tips #

66944次浏览 449人参与

# 贝壳求职进展汇总 #

35617次浏览 196人参与

# 机械人值得去的小众企业 #

24009次浏览 54人参与

# 校招谈薪一定要知道的事 #

1621次浏览 29人参与

# 你觉得什么岗位会被AI替代 #

3088次浏览 60人参与

# 秋招结束之后的日子 #

87528次浏览 985人参与

# 浪潮求职进展汇总 #

17592次浏览 137人参与

# 投格力的你，拿到offer了吗？ #

118766次浏览 686人参与

# 新凯来求职进展汇总 #

51295次浏览 131人参与

# 职场新人体验 #

86290次浏览 610人参与

# 机械制造面试点评 #

72019次浏览 452人参与

# 招银网络求职进展汇总 #

171672次浏览 997人参与

# 秋招盘点:机械人值得去的企业 #

85590次浏览 709人参与

# 面试被问“你的缺点是什么?”怎么答 #

155783次浏览 2206人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务