23秋招 阿里高德部门机器学习 面经

更新:已挂
9月1号投递的算法工程师-机器学习岗,高德部门

9.5一面 (50min)

总结:面试分四部分:简历项目+基础知识+场景题+做题

  • 自我介绍
  • 简历项目比赛介绍+提问
  • 问了许多深度学习和机器学习的基础知识:
    • 卷积 vs 全连接
    • 怎么理解卷积?
    • 图片的物体发生位移或扰动,对CNN有影响吗?
    • 池化的作用
    • 随机森林 vs GBDT
    • 随机森林和GBDT的基分类器可以改成线性分类器或者其他吗?
    • 分类问题的损失函数CE(交叉熵)可以换成MSE吗?
    • MSE有一致性(预测值的均值与真实值的均值接近一致),CE有一致性吗?
    • 已知一个模型在测试集上的偏差较大、方差较小,分析原因并解决
    • 暂时只能想起来这么多。。。
  • 场景题:用户从一个起点打车到终点,如何为用户推荐上车点?给出上车点的定义,问题的定义,以及如何利用各种信息建模来给出上车点。已知用户的各种历史信息包括历史打车的信息、偏好上车点等等
  • 概率论题:已知某种罕见病的检测准确率是98%,实际人群中患病概率为x,小张某天去医院检测该病为阳性,那么他实际患病概率是多少?
  • 算法题:没有测试用例,只需要写代码就行。
    • 输入一个数组x,求最大的差值 xi-xj(i<j),要求用O(n)的时间复杂度。
  • 反问

9.22二面 (1h)

总结:面试分四个部分:研究方向+项目提问+基础知识+场景题,无手撕

  • 自我介绍
  • 研究方向提问
  • 项目提问
  • 问了一些基础相关的问题:
    • 讲一下LSTM内部结构
    • 讲一下GRU内部结构,相比LSTM有什么不同?
    • XGBoost在构造每棵树时,优化目标是什么?相比GBDT算法上的不同?
    • 梯度消失有哪些解决办法?
    • 有一些输入的图片,想学习旋转不变性,有什么办法?(回答了加池化,面试官说池化不是网络必需的,有没有别的办法,不太明白他想问还有什么办法,数据增强吗?)
    • 已知有一个数据集线性可分,用LR训练会收敛吗?(应该是不会收敛,参数会越来越大)
  • 一个开放性或者说是数学问题:
    • 已知平面上5个点,如何求离这5个点欧氏距离之和最近的点?答:可以用蒙特卡洛模拟,在5个点组成的闭包里采样足够多的点,距离之和最小的应该就是近似解。面试官:这个是可以,能算出它的收敛速度吗?答:不会。。。面试官:这个收敛很慢,有没有收敛速度是根号n分之一的方法?答:不会。。。(下来查了相关的问题,一个相关的链接贴在这 )
  • 场景题:
    • 高德打车相关,app每天为用户推送一个打车的广告来促使用户使用高德打车,现在采取的笨方法是每天固定的时间推送一次,比如早上8点,但这个时间用户可能已经打过车了。设计一个算法,以及用到哪些数据或特征,为每个用户每天提供个性化的推荐时间,每个用户每天还是推送一次。
  • 反问了业务以及面试流程,如果通过可能还有一轮技术面和一轮HR面
#阿里巴巴##面经##机器学习##高德##23届秋招笔面经#
全部评论
面日常实习也问的这些,每个问题完全一样,我怎么没提前来搜一下
1 回复 分享
发布于 02-17 16:28 四川
我今天下午也是高德,也是历史信息建模,我怎么没提前搜一下😅
点赞 回复 分享
发布于 2023-04-18 00:56 天津
大佬你什么背景,感觉什么面试都能进,我投的阿里高德视觉直接挂了🤣
点赞 回复 分享
发布于 2022-09-06 21:32 安徽

相关推荐

一面:全程50min,八股30min,算法20min1.&nbsp;innodb引擎的rr级别,age是普通索引,id是数据库主键,递增字段。事务A:begin;T1&nbsp;select&nbsp;*&nbsp;from&nbsp;user&nbsp;where&nbsp;age&nbsp;=&nbsp;20;(2个结果)T3&nbsp;select&nbsp;*&nbsp;from&nbsp;user&nbsp;where&nbsp;age&nbsp;=&nbsp;20;T4&nbsp;update&nbsp;user&nbsp;set&nbsp;name&nbsp;=&nbsp;'name1'&nbsp;where&nbsp;age&nbsp;=&nbsp;20;T5&nbsp;select&nbsp;*from&nbsp;user&nbsp;where&nbsp;age&nbsp;=&nbsp;20;comit;事务B:T2&nbsp;begin&nbsp;insert&nbsp;into&nbsp;user&nbsp;values('name2',&nbsp;20);&nbsp;comit。请你分别告诉我T3-T5各有几个结果?2、3、32.&nbsp;TIME_WAIT&nbsp;状态原因?ack至少丢失一次;防止建立历史连接3.&nbsp;设计一个抽奖系统,每个用户可以抽&nbsp;m&nbsp;次,奖品个数为&nbsp;n,每个用户最多只能中奖一次,大流量场景下如何设计,可以支持百万级并发抽奖?从接口、逻辑、扩展方面依次回答了。4.&nbsp;算法:130.&nbsp;被围绕的区域======================================================================二面:全程&nbsp;40min,项目&nbsp;15min,算法&nbsp;20min,反问&nbsp;5min1.&nbsp;自我介绍2.&nbsp;说下实习干了啥?大致介绍了下,然后说的实习难点3.&nbsp;接口重构做了什么?说了过程,说了上线策略4.&nbsp;你们后端服务大致拆分了几个服务?为什么那么拆分?5.&nbsp;慢&nbsp;SQL&nbsp;治理的过程和原理?6.&nbsp;其他记不清了7.&nbsp;算法:LCR&nbsp;084.&nbsp;全排列&nbsp;II。中间看成了全排列,5&nbsp;分钟秒掉结果调试半天没有输出,经提示有重复数字。抠了半天抠出来了======================================================================三面:总共&nbsp;70min,实习+项目+八股&nbsp;20min,算法&nbsp;50min1.&nbsp;自我介绍?2.&nbsp;实习工作?3.&nbsp;Netty&nbsp;为什么快?4.&nbsp;详细说下&nbsp;NIO?5.&nbsp;各种其他问题,记不清了6.&nbsp;算法:31.&nbsp;下一个排列总结:栽在三面了,唯一一次原题没写出来。当时写&nbsp;hot100&nbsp;就没细看,感觉这题有点难,结果唯一一次出原题我还没写出来!
查看11道真题和解析
点赞 评论 收藏
分享
一面:全程&nbsp;55min,实习项目八股&nbsp;20min,算法&nbsp;30min,反问&nbsp;5min1.&nbsp;自我介绍2.&nbsp;你的接口对接开发主要是干了什么?3.&nbsp;对方接口变更,你们这边受影响的范围怎么样?4.&nbsp;慢&nbsp;SQL&nbsp;治理怎么发现的?怎么治理的?5.&nbsp;用过什么中间件?mq、redis、mysql、配置中心、rpc6.&nbsp;rpc&nbsp;用的什么框架?选的什么序列化器?7.&nbsp;mq&nbsp;怎么保证消息有序性?mq&nbsp;组件?8.&nbsp;mq&nbsp;延迟队列的原理是什么?9.&nbsp;redis&nbsp;哪个数据结构能实现延迟队列?10.&nbsp;mysql&nbsp;建过表吗?11.&nbsp;mysql&nbsp;索引?为什么?12.&nbsp;java&nbsp;线程池了解吗?说下参数?13.&nbsp;jvm&nbsp;参数会设置吗?让你设置你怎么做?14.&nbsp;redis&nbsp;内存满了会怎么样?15.&nbsp;内存淘汰策略?lru&nbsp;和&nbsp;lfu&nbsp;底层数据结构是什么?16.&nbsp;算法:实现&nbsp;LRU,要求:单例模式、写出单元测试17.&nbsp;反问:业务?18.&nbsp;反问:主要编程语言?总结:面试官让本地写代码,但是我编程主力是&nbsp;mac,面试电脑是&nbsp;win,导致&nbsp;idea&nbsp;写一半显示过期了,折腾半天都没搞定。后面尝试下载社区版,但是速度太慢。最后用&nbsp;cursor&nbsp;写的,根本跑不起来,但是代码都写完了,面试官说思路没有问题。======================================================================二面:全程&nbsp;50min,实习八股&nbsp;30min,算法&nbsp;10min,反问&nbsp;10min1.&nbsp;自我介绍?2.&nbsp;家在哪里?学校在哪里?对京东很了解吗?3.&nbsp;说下实习干了什么?4.&nbsp;实习难点在哪里?5.&nbsp;linux&nbsp;指令考察?写一个&nbsp;shell&nbsp;统计一个文件夹下所有&nbsp;jpg&nbsp;格式的文件的大小,文件夹存在递归。6.&nbsp;数据库用了吗?写的需求是什么?7.&nbsp;实习哪些表分表了?分表怎么做的?8.&nbsp;其他记不清了9.&nbsp;算法:合并&nbsp;k&nbsp;个有序&nbsp;list。hot100&nbsp;合并&nbsp;k&nbsp;个升序链表的魔改版10.&nbsp;反问:几轮面试?总结:许愿oc吧
查看22道真题和解析
点赞 评论 收藏
分享
1️⃣自我介绍:【⌚️10分钟】点评:流水账,有些磕磕绊绊,自我介绍环节的项目介绍的很详细,非常冗余。优化:写逐字稿,背诵,提升语言表达能力。2️⃣经常问题的问题优化:【⌚️20分钟】1:transform结构了解吗?回答点评:回答的很简单,5分吧,说了transform的结构是encode-decode结构,分块,每个块里面有四个组建,MHA、FFN、LN、残差链接,介绍和理解不深刻。提升指导:梳理回答逻辑结构,讲解MHA、FFN、LN、残差链接的添加逻辑和含义,其中MHA给出代码层面理解,从2分钟的回答变成6分钟的回答。2:多头自注意力机制是啥?公式是啥?代码你会写吗?回答点评:讲了公式,但是掌握的不够细致,pytorch代码框架不熟悉,attention_mask机制没有写出来。提升指导:讲述代码的原理,如何使用代码回答问题,展示自己的理解深刻。3:rag中的多路召回是什么?embeding为啥用智源的BGE-large/Base?回答点评:使用了BM25和向量召回,但是没有讲出来两个的区别和联系提升指导:先讲原理,再讲述下语义理解能力和泛化能力的区别,计算的效率,两个互为补充等。3️⃣不会回答的问题指导:【⌚️40分钟】1:&nbsp;&nbsp;LN不太会回答,看网上的回答很多,但是不是理解层面。2:我的向量召回是faiss做的,和这个相关的问题我如何准备?3:经常会被问到rag用的啥框架,这个问题如何回答?还需要准备框架的知识吗?4:面试官经常问我,rag的模型是啥?有做微调吗?如果不做微调怎么回答?5:大模型还需要补充那些知识?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看8道真题和解析
点赞 评论 收藏
分享
评论
8
85
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务