信也科技——数据挖掘面经

2020.9.15投递
2020.9.18笔试  七道主观题  3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目
————————————————————————————————————————————
2020.9.25 一面有些记不太清除了
自我介绍

挖实习经历:风控相关:解释一些WOE值是怎么计算的,IV值是怎么计算的

还有就是一些风控建模细节

大数定律

线性回归的拟合优度$R^2$是怎么计算的

解释一下P值的概念

对信也了解吗?以前的拍拍贷

如果客户一直对你的模型不满意怎么办

解释一下过拟合(有好多家笔试都考到了的)

撸了一道sql题 两表连接+筛选条件 比较简单

整体体验蛮好的

反问:平时的主要业务和工作是什么?
————————————————————————————————————
2020.9.30 二面

没有自我介绍,面试官上来就吐槽我的简历太简洁(要不是一面的面试官问了很多问题都不知道我做了这么多工作),尴尬。。。  投递的有些匆忙,用的是最开始的简历

挖实习经历

中心极限定理(我忘记了,说我对大数定律比较了解,然后讲了大数定律)
**大数定律、中心极限定理真的很重要,研究生复试问到了,找工作也还是逃不掉啊**

树模型、gbdt的实现过程  不要原理,要实现过程  我讲了一堆boosting的原理,还有gbdt和adaboost的区别与联系  但是面试官还是说我说的是原理  引导问:决策树是怎么生成的,我就简单讲了下基于信息熵、信息增益、基尼指数、平方损失等,选择分裂节点,然后对于子树进行递归操作

xgboost是怎么分裂的?  没答上来

boosting和bagging的差异? 信手拈来

lightgbm和xgb的区别?xgboost是预排序  lightgbm是基于直方图,无论存储还是计算都要快很多

xgb,lightgbm的调参? 贪心算法,优先调重要的,然后调次要的

怎么降低过拟合 调整顺序  优先调什么?

建模时xgboost的损失函数是什么样的?(没答上来,忘记了。。。应该是回答auc吧)  追问了解mae和mse吗? 解释一下两者的差异?

面试官看我用过catboost,让我讲一下(我只是用过,没有太深入的进行了解,就讲了一下处理类别变量的优势)

评分卡模型了解吗?讲一下步骤

评分卡模型得到的分数在某一个分数段上比较集中该怎么处理?

有多少家公司正在面?

你有想去的地方吗?你的计划是留在一线城市嘛?

反问:数据挖掘岗平时的主要工作是干什么呢?(好像问了和一面一模一样的反问,不过两个面试官给出的角度还是不太一样的,不过确实是我想做的风控建模的工作)

国庆后给通知么?(是的) 本来复试想推倒国庆后,国庆好好准备一下的,不过hr说,复试的流程要在国庆前结束。

二面的整体感觉也是很棒的,感觉面试官问的很技术,问到了各种算法的细节。我也还需要继续努力学习其中的细节。

————————————————————————————

希望可以帮助一些想要从事风控的同学们

————————————————————————————

2020.10.15 已oc  感谢帮助过我的小伙伴们
#面经##校招##数据挖掘#
全部评论
Lz后续有消息吗?
3 回复 分享
发布于 2020-10-13 01:15
请问二面过后还有hr面吗
点赞 回复 分享
发布于 2021-10-21 19:59
请问像风控模型分析和机器学习的题目都是什么形式?选择,简答题?
点赞 回复 分享
发布于 2020-10-12 22:27

相关推荐

找工作勤劳小蜜蜂:自我描述部分太差,完全看不出想从事什么行业什么岗位,也看不出想在哪个地区发展,这样 会让HR很犹豫,从而把你简历否决掉。现在企业都很注重员工稳定性和专注性,特别对于热爱本行业的员工。 你实习的工作又太传统的it开发(老旧),这部分公司已经趋于被淘汰,新兴的互联网服务业,比如物流,电商,新传媒,游戏开发和传统的It开发有天然区别。不是说传统It开发不行,而是就业岗位太少,基本趋于饱和,很多老骨头还能坚持,不需要新血液。 工作区域(比如长三角,珠三角,成渝)等也是HR考虑的因素之一,也是要你有个坚定的决心。否则去几天,人跑了,HR会被用人单位骂死。
点赞 评论 收藏
分享
评论
14
93
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务