BigAI 一面

北京通用人工智能研究院
两个面试官一男一女
1. 自我介绍
2.项目
你决定你这些数据处理的工作,心得是什么?
为什么你会用 Qwen2 而不是其他模型?
如何评测你所谓的对话风格?目前有什么优化点?
对话记忆这块你是怎么做的?具体讲一下。(中间讲到 mem0,还一起吐槽了一下这个项目不值得那么多🌟)
手写一下 DPO 的 loss(中间还写错了一个 sigmoid 写成了 softmax)
为什么公式里要 ref 模型?
DPO 被称为数据分布偏移敏感,你知道是什么原因吗?(草,啥玩意)
有了解过传统的 RL 那块吗?(不了解)
有用过推理加速啥的吗?讲一下

代码题
1. MultiheadAtten 
2. BPE 分词(这个代码是真折磨啊,没写过主要是,写了个很庞大丑陋的代码, 最后有几个 bug 所以没跑通,反正就是面试官两个人也反复跟我拉扯代码细节,就是硬要我跑一下。。。后面还是遗留了一个 sort 字典的 bug 没跑通,就发了份我的代码,面试官说线下他在慢慢看)
BPE 这题拉扯了 30 分钟,他们真的好认真在面试。
全部评论
这个所看重学历吗?
点赞 回复 分享
发布于 2024-12-27 17:51 北京
哪个部门啊~
点赞 回复 分享
发布于 2024-11-17 14:10 天津
佬这个所怎么样啊
点赞 回复 分享
发布于 2024-10-03 10:31 辽宁
请问,你的北京通用人工智能研究院的面试是邮件通知还是电话通知?
点赞 回复 分享
发布于 2024-09-28 07:53 湖北
佬面了多久,我被拷打了一个半小时😅
点赞 回复 分享
发布于 2024-09-26 18:56 北京

相关推荐

07-25 10:31
门头沟学院 Java
求问各位大佬,笔试都考点啥
投递科大讯飞等公司10个岗位
点赞 评论 收藏
分享
LazyBreeze:项目尽量体现你对技术的理解和深度,不是说把中间件用一下就完事了,你项目里面提到集群和分布式,你真在服务器上部署过吗,感觉太假了,第二个项目说自己用了微服务的什么组件,只是用了没有自己的思考,很难让面试官注意到你的简历。针对某几个技术点自己多思考一下,考虑一下有没有别的替代方案,可以写一下,即使没有真的实现
点赞 评论 收藏
分享
评论
6
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务