腾讯实习-光子工作室群-客户端开发(具身智能方向)一面+二面+HR面面经 已oc

一面7.24

1.简单自我介绍

2.有没有大体量模型部署/调优经验?看你简历里都是小模型? 答:没有

3.这边看你使用了tensorrt,有没有遇到爆内存的情况? 答:没有,因为用的yolo模型也是小体量

4.你在边缘段部署模型的时候,如果遇到算力不足的情况,怎么解决?有没有尝试过模型调优?如果量化,量化后导致的精度问题如何解决? 答:尝试过量化,量化后再做微调解决量化导致的精度问题。

5.你的实体机器人有没有尝试去跑公开的benchmark数据集? 答:没有,主要适配学校本地场景。

6.你的实体机器人有没有遇到过数据不同步的情况?比如机械臂压力传感器信息已经获取了,但是视觉信息还未捕捉到抓取动作?如何调优? 答:没有深入做过机械臂相关,不过我给出的方案是两边设备做通讯,当遇到不同步情况时抛出异常,让两边线程停止,同步后再继续执行。 面试官给出建议:如果持续开启同步,可能会浪费很多性能,因为同步只有在发生异常时才起到作用,实际可行思路是对两边信息进行预测,与其等信息到齐再同步,不如基于已有的信息做时间插值或状态预测,提前“推测”另一方的状态,以实现更平滑、高效的控制。

7.RAG系统中,你的数据是如何存储在数据库中的?用的算法是自研的吗?在问答时有没有遇到过RAG生成模型幻觉问题(可能始终只围绕提供的材料进行问答,而无法跳出材料)? 答:通过视觉语言大模型进行PDF-Page向量化并存入数据库,算法不是自研,是基于已有框架二次开发。问答出现幻觉说明系统没有加入保底机制,认为所有问题都能在知识库中找到答案,需要对输入问题进行预处理,剔除不相关问题。

8.KCF优化怎么做的?

9.看你有VLA Zeroshot模型的训练部署经验,你是如何去做部署调优的? 答:我们项目中可能不算zeroshot,我们实际上是在同一栋办公楼中去拍摄第一人称的行走视频,并人工标注对应时间序列上的行为决策,将其作为训练数据训练大模型,再在其他未被作为数据集拍摄的场地去做测试。对应的上层决策和我的底层执行基元作适配即可(比如视频里是人移动,实际是小车移动,移动方式不同但决策/轨迹相同)。但实际测试下来,对于室内复杂位置环境的主动探索效果并不好,因此并没有落地。

反问:岗位时客户端开发,实际是具身智能方向,具体是做哪方面的应用? 答:客户端开发是个很大的分支,有很多子分支,具身智能是其中之一,主要做游戏相关内容向实体机器人迁移,利用实体机器人收集数据等。

二面7.25

1.简单自我介绍

2.项目中提到的机器人硬件系统都是自己搭建的吗? 答:除了移动底盘是直接购入的,其余硬件都是自己搭建(上位机、电源、雷达、相机、麦克风等)

3.人机交互系统是怎么搭建的?交互的方式是什么?用了什么语音合成、语音转文字模型? 答:交互平台放在网页端,可以通过移动端交互,解决复杂环境下机器人不好收音的问题。模型用的两个国外开源小模型。与机器人移动相关的数据通过ROS2 DDS通信,交互部分通过Python HTTP。

4.看你做过VLA任务,你的做法是什么? 回答=一面

5.讲一下ROS2的结构特点

6.你对C++了解程度怎么样? 回答是能阅读代码,然后上来就是两个底层问题,直接昏迷没答出来。

7.讲一下A*算法

8.有一个哈希表,每个哈希值对应一个QQ号,现在我有一个新的QQ号需要进库,我想判断这个QQ号在库中有没有重复,怎么做? 答:直接计算QQ号的哈希值,没有哈希冲突复杂度O1,有就遍历链表,最坏情况On

9.你知不知道悟空机器人?有没有了解过机器人模块化编程用于助教?答:没了解过悟空机器人,没有做过模块化编程助教的工作,不过当前机器人的控制都是基元化,可以理解为让大模型辅助去做模块化编程,拼接基元完成复杂任务。

反问:岗位是做什么的? 答:整个大部门有很多分支,引擎开发、建模绘图等生产力工具改进、AI等,具身智能是近期新开辟并准备探索的领域。

HR面8.4

1.核实了一下岗位具体业务,腾讯不做实体机器人,好像是XR相关的

2.实习时长

3.实习期望接触的研究方向

8.5转评估,许愿oc

8.20oc base深圳

全部评论
你好这是校招吗?感觉和客户端没啥关系
点赞 回复 分享
发布于 09-01 16:08 北京
光子还有做具身智能?
点赞 回复 分享
发布于 08-01 09:59 广东

相关推荐

评论
3
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务