淘天淘宝直播大模型实习一面

📖面试问题:#找实习#(4.9)
Q1:简单介绍一下在研究生期间的科研和实习经历。
Q2:介绍一下简历上那个完整的大模型项目。
Q3:做这个项目的背景,做项目的动机。
Q4:第三个项目是实习项目吗?
Q5:对第1个项目有用NER的方法吗?微调前base模型的准确率是多少?
Q6:第2个项目的数据集构造是不是有问题?这些数据的判断是不是对大模型来说太简单了?
Q7:有用传统方法来测你构造数据集的有效性吗?比如用BERT
Q8:介绍一下Lora的原理。
Q9:LORA基于什么问题,什么样的模型可以用LORA进行微调?什么是低秩分解?
Q10:LORA的初始化方法。
Q11:两个权重矩阵的初始化。
Q12:项目中的可解释性模块是什么?
Q13:介绍一下Int8和FP32的区别是什么?
Q14:Int8的表示范围。
Q15:Int8和FP32前向计算的区别。
Q16:除了大模型,你对推荐系统,CV模型有了解吗?
手撕代码:lc82. 删除排序链表中的重复元素 II
反问:
做什么业务(淘宝直播生态和主播智能手卡)
进组后做什么业务(预训练)
🙌面试体验:挺好的,注重业务,八股并不多。
全部评论
佬,你第一个项目大概是做什么的
点赞 回复 分享
发布于 05-16 10:32 湖北
佬 这个有后续嘛
点赞 回复 分享
发布于 05-08 10:43 黑龙江
算法岗?要不要看看我们这里的急招
点赞 回复 分享
发布于 04-11 16:56 天津

相关推荐

04-24 20:41
已编辑
门头沟学院 Java
3.12投递,3.17写完笔试,4.18HR电话约4.22一面。以为早挂了结果突然约面,令人忍俊不禁。补充一下:笔试都很简单但只A了2,最后一个因为NT输入输出卡了二十分钟直接不写了交了。录音没录上,想最小化录音结果关闭了大部分由项目衍生八股和场景写一些记得的1.用到了Redis,如何用的?(缓存热门商品)2.存储的数据结构,用了哪些?有哪些?(用了字符串,只追问了字符串实现)3.数据一致性,手段有哪些,你项目里怎么用的?4.对于高并发大流量场景,除了缓存还有什么手段?(随便说了些,从前端到CDN到负载均衡服务器到布隆过滤器)5.MySQL服务器存什么,如果百万订单如何设计?(寄)6.MySQL ACID如何实现,提到MVCC,追问MVCC原理。然后问索引失效原因,深分页为什么慢。(深分页不太会)7.用了RocketMQ吧,为什么不用其他的,有什么用?(事务消息,削峰填谷,定时删未支付订单)8.八股开始:你这项目是HTTP通讯吧,HTTP1.0和2.0区别和优化?(不会,寄)9.如何创建线程池?(忘记了类名,答得不好,其实就是ExecutorService结合工厂模式)10.聊聊数据结构:百万数字求Top100怎么搞?(答优先队列,堆;多线程归并,问还有吗,不知道。。。)11.聊聊设计模式:策略模式怎么用?12.手撕LC240,搜索二维矩阵II(忘记最优解了,写了每行搜然后二分,后面面试官告诉我最优解了,寄)13.反问:对实习生要求?基础好,学习能力好。最晚什么时候知道结果?一周。正常面试体验,不过答出来和没答出来面试官都说好的好的,没什么反馈。周二面完周四感谢信。意料之中,不过这回效率挺高。暑期寄完了,洗洗睡。
查看12道真题和解析
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
2
13
分享

创作者周榜

更多
牛客网
牛客企业服务