北京力拓飞远科技有限公司一面

多模态算法实习生

2026.01.20,上午10:15,一面,线上,10多min,面试官没开摄像头 1.自我介绍 2.MindIE 现在的发展情况如何? 在 910 服务器上,Mind IE 的性能比 VLLM 和 SGLang 等要快,都是适配该服务器的版本。 3.用 OneBench 测试时测吞吐了吗? 没有做模型性能压测,只做了精度测试。 4.为什么选择这三个数据集做测试? 因为是用中文数据微调,所以选中文数据集,LOGI 是中文逻辑推理数据集,MUSR 是中文意图识别数据集,还有一个综合类中文通用数据集,从不同角度对比能看出性能差异。 5.Qwen3 的 8B 有 thinking 能力,你用了这个能力吗? 用了,默认是打开的,没有关闭。 6.观察过加 thinking 和不加 thinking 的性能差异吗? 没有进行对比,当时都开着 thinking 进行对比。 7.对比过910B和 A100的性能差异吗? 没有,因为实习时用的全是 910B 服务器。 8.MindIE 是用 MindSpore 写的还是用 Torch 写的? MindSpore 写的。 9.写过 MindSpore 相关的源码类项目吗? 没有,只用过其生态下的 MindFormers 进行过模型微调。 10.有 GitHub 账号吗?方便发在评论区吗? 有 GitHub 账号,但不方便发在评论区。(不知道为啥突然问这个) 11.RAG 项目中用的是什么嵌入模型? 用的是Qwen3-Embedding-8B嵌入模型,还加了 Reranker。 12.你觉得 RAG 有哪些优化空间?如果Word或PDF中是表格类型的数据该如何处理? 优化文本切分方式,目前是按固定长度切分,可按语义段落切分;若段落超过嵌入模型的 context 长度(千万三嵌入长度 4096),可写判断语句截断,尽量保留完整语义;对于 Word 或 PDF 中的表格数据,可按行切分,将表头添加在每行信息前,让模型理解数值含义。 13.最近关注过哪些感兴趣的 paper 或架构? 关注过 Gemini3,性能不错;其他 paper 没太关注。

14.你现在是大四还是大三?

大四,今年九月份读研。

15.毕业设计确定了吗?能介绍一下毕业设计项目吗?

基于 AIGC 文本检测的设计与实现,设计一个系统,传入文本数据,判断该文本是 AI 生成的概率。

16.用 VLLM 部署 Qwen2-Audio 模型是用来做什么的?为什么不用 Mind IE 部署这个音频模型?

给客户提供音频推理服务,客户调用接口完成相关需求,我负责模型部署。当时用的MindIE 2.1.RC1,不清楚现在的 2.2.RC2 版本是否支持。

17.实习结束了吗?

结束了(其实今天是倒数第二天

18.如果还想用昇腾的卡,有渠道吗?

无,且想用 GPU 的卡。

无手撕

反问:主要业务是什么?

主要做机器人相关工作,涉及到一些模型推理服务。

感受:面试只有10几分钟,感觉可能是面试官对自己不感兴趣,面试完看这个岗位居然还关闭了,以为是已经有合适的人了,感觉凉凉了。但是大概1小时后居然约了二面?!而且就在下午17:30。

#面试问题记录#
全部评论

相关推荐

ldyllic:飞神,985+美团+腾讯+京东,无敌飞飞神
点赞 评论 收藏
分享
等闲_:小红书基本不区分日常和暑期,你是应届实习时间够了就有转正机会,只要部门有hc
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务