腾讯TEG-AI平台部-技术研究日常一面

3月初面的,当时暑期没开
面试官开始先做了部门介绍,以及业务内容,需要实习6个月以上
1.R1复现方案,奖励函数为什么这么设置?有考虑过数据泄露的情况吗,就是如果你改的这些题目比较相似的话?有没有出现中英混答的情况?怎么解决?为什么你的最后结果没有突破到更高的分数?你说你用的Kimi K2和Gemini,是什么形式的?API还是网页?如果说不是输出你的奖励词语,也是可以做到推理的,你怎么考虑这个问题?
2.手机助手项目拷打:介绍背景,怎么做的。如果我现在的场景是APP更新之后,点击的模块发生变化,你会怎么解决这个问题?如果是上下滑动找商品呢?
3.GRPO如果组内设置的size非常小的话会怎么样?
4.GRPO的平均是怎么计算的?
5.场景题:如果让你来搭建一个LOL的陪玩助手,你会怎么搭建?(这里我没明白这个助手是要当辅助这种还是就一个语音助手就行了,面试官说语音的助手就行了)可以从数据选择,整个架构设计来说。如果用户发现你的这个助手语气太生硬了,你怎样解决?如果版本更新,装备这些东西变了,你是训练到模型里面去的,模型需要重新训练吗?有没有什么解决办法?如果是LOL你在对线的时候,发生了小龙团,你怎么样让助手去做这种场景的一个提醒规划?
6.有了解过MOE模型吗?主包只记得激活参数小很多😭
7.讲下PPO
8.LoRA原理,AB矩阵初始化
9.MCP和Skills有了解吗?
10.代码:先写打家劫舍,然后改进输出具体打劫了哪些
11.多久能到岗?能实习多久?导师那边没问题吗?
12.反问:HC?有,需要和暑期同学竞争#27届实习投递记录#
全部评论
PDD考虑吗,agent研发急招人,帮跟踪进度:https://careers.pddglobalhr.com/campus/intern?t=47LjBxZ34k
点赞 回复 分享
发布于 04-10 10:47 上海

相关推荐

04-15 17:41
已编辑
南京林业大学 后端工程师
发面经攒人品两周前一面的,一直没有消息,这周突然二面了一面忘记录音了,只记下来一点三道手撕- 第一题压根没见过,提供了两种指令,要求用这两种指令实现判断字符串是否符合某种性质(不会)- leetcode240搜索二维矩阵 II,hot100题目(还有点记忆)- 给定一堆用户的在线时间记录(格式为[登陆时间,退出时间]),求姐同时在线用户最多的时间段八股环节,他让我选则计网或者系统,我选了计网- http从1开始一直3,每次改进了什么,解决了什么问题- http1.1的头堵塞问题是什么意思- http2为什么会有头部堵塞- http3怎么解决头部堵塞的- 为什么用udp的QUIC协议能将解决头部堵塞- 讲一下https握手- 每次https都要四次握手,代价很大怎么优化?用长连接- 长连接的https万一密钥泄露了怎么办?设定一定的时间,定时重握手二面1. 哪里人,在哪里上学2. 自我介绍3. 讲一下mcp4. 讲一下skill5. 你有一个智能agent项目,讲一下什么叫做智能6. 我想设计一个智能告警系统,有四个项目需要监控,每个项目每天都有致命告警。但是这些致命告警有一些是错报,因为这些告警是别的同学配置的,我没有办法去掉。有两点:一是该系统需要能够同时监控多个项目,二是告警出来后需要去查代码是什么意思或者调用一些工具进行自动化处理。你认为这个系统应该怎么设计?7. 这个系统的rag里面存什么?tool要封装哪些工具?怎么agent按照某个流程执行检查?8. 你简历上的这个项目与刚刚我想要的那种系统很像,你能讲一下两者之间的差异吗9. 你刚刚说到了兜底逻辑需要做一些,能来讲一下大概要做哪些兜底逻辑吗?10. 你平时用什么ai工具,怎么用?11. 用过openclaw吗?12. 讲一下实习项目13. 实习的时候主要是做前端还是后端?14. 怎么实现一个分布式锁,设置超时时间?15. 假设有abc三个在抢锁,简单介绍一下情况。然后a挂了会怎么样,你能从代码级别描述一下吗?16. 你知道MongoDB吗?17. 一分钟快速介绍一下事务的ACID18. 一致性怎么保证?代码中怎么实现?19. 你怎么理解消息队列中的消息持久性20. 讲一下消息队列怎么保证持久性?21. 万一消息队列磁盘坏了怎么办?22. 写操作是只写那个主消息队列吗?23. 了解https算法吗?24. rsa个ec算法有什么区别?不知道25. 你用过哪些对称加密算法?只知道凯撒密码26. 10个业务,一天1亿个计算任务,10万台机器资源,构建一个分布式计算平台。任务大多是cpu型任务,有长又短。你会怎么设计这个平台?27. 你的路由层用多少机器?28. 假设用了三台机器来管理,然后其中要有一个leader,怎么选出一个leader?29. 基于redis实现选举,怎么实现?一开始我说模仿哨兵模式,用一个哨兵节点负责选举。他要求我不用哨兵,就用三台机器和一台redis实现选举30. 现在解决了主master的问题,接着怎么调度?讲一下怎么调度的设计思路31. 假设某一瞬间来了很多请求,你怎么保证所有机器不会被打爆?32. 现在有很多新的技术,你怎么看待新技术,是出来一个就学一个吗?还是怎样一个态度?33. 你怎么学习一个新技术,讲一下思路和方法34. 平时会有多人协作的工作吗?35. 研究生的研究方向是什么?平时干什么?36. 了解编解码算法吗,比如h264和h265,我们这边可能涉及到多媒体数据格式的转化,你了解多少?37. h264中的视频帧分成哪几种?好像是分三种,具体不知道38. h264和265的区别?不知道反问:1. 部门做的是存储、多媒体相关的,我没有这方面背景,对实习生要求是啥?进来后再学,要有自学能力、自驱力2. 转正要求,转正率是多少?50%以上。(存疑,tx转正率有这么高吗)3. 具体业务场景:提供存储服务,用户上传存到这里,访问的时候再下发。面试官追问:1. 你有没有其他offer?
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务