荣耀算法实习 技术面经

感觉自己好菜、面试很难,还是要多多练习
1.项目介绍
2.手机助手项目背景,奖励是怎么分配到每一步的?数据量大小?长短链路比例?正负样本数据量?
3.R1复现数据分布?你怎么确定你的方案是有效的?采用的什么框架?GRPO相对于PPO有什么缺点?PPO到GRPO的思路?
4.为什么现在在实习还会投实习?
5.看过R1的文章是吧,讲一下他们是做了多少论训练。
全部评论

相关推荐

昨天 00:07
已编辑
哈尔滨工业大学 golang
📍面试公司:字节跳动🕐面试时间:2.6投简历 推到2.26一面 2.27二面 3.2三面 3.6hr面 3.16 oc❓面试问题:一面面试官比较新手,先自我介绍一下,然后好奇了一下我的比赛都在做什么。然后考了一点八股链表和数组的区别/应用场景快排的原理哈希表的实现和冲突解决红黑树和avl树的区别和应用(读多写少/读少写多)dp是什么,思路进程线程协程的区别goroutine的gmp模型死锁是什么,怎么避免linux io模型和复用虚拟内存和页表的过程tcp的三次握手四次挥手tcp/udp的区别和应用tls的握手过程go的runtime负责做什么,如何垃圾回收然后拷打20min项目最后给了两个简单的算法题,一个是字符串中最长的不重复字符串,一个是矩形网格左上走到右下权值最小路径二面二面拷打的比较厉害,比较紧张记不太清了上来先问了问八股,没问算法相关的,直接问的操作系统相关的仔细问了问线程切换和协程切换,c++的协程和goroutine有啥区别goroutine的工作窃取怎么做的深入拷打死锁,还有银行家算法怎么做的拷打项目,比较深入,结合这个项目为啥这么设计和怎么调试(因为我讲了中间遇到竞态问题)三面三面就面试了半小时,没怎么问八股聊了聊python,golang,c++的区别,应用场景解释器和编译型区别,为啥要用golang 还有runtime逃逸分析啥的,比较聊天然后聊了聊agent开发(有一个相关项目)的事,还问了问用没用过openclaw 有啥感想最后问了下期望的工作地点和到岗时间就结束了
查看26道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务