实习蚂蚁多模态算法二面 压力面

感觉还挺难的,还得多练...
1. Qwen2.5-vl pretrain 阶段用了哪些数据?分别大概用多少数据量?
2. 对齐任务一般放在哪个阶段进行?你在 training 的时候long cot 能力下降了多少,有评估吗?
3. 小米的 work 看了吗?
4. chartQA 的方向有了解吗? 你觉得有哪些优化方向?
5. MLLM 不做对齐会有什么结果?你有考虑你的场景下做增量预训练吗?
6. AI 生成检测你的方法对新出现的生成器来讲,效果如何?有评测过吗?
7. 可解释性生成你是如何做的评估?给我讲一讲这几个指标以及为什么起作用。
8. sim 评估用什么做的?如果你用 LLM 训一个专门用来评估,和你用 sim 的评估方法有什么区别?用多少数据量来训这个?可以当奖励模型吗?
9. MLLM 做 rl 会有提升吗?假如你对 grounding 任务做 rl,需要注意什么
全部评论

相关推荐

1、自我介绍2、Agent项目是实习项目还是个人项目?有没有上线?3、拷打实习(10min)4、大模型微调,你的训练数据集是如何构建的?数据量有多大?5、在构建数据集的过程中,遇到了哪些挑战?花了多长时间?6、你之前的实习经历偏后端工程,你未来的职业规划更倾向于纯后端开发,还是希望从事与AI/大模型结合的工作?7、详细讲一下Golang中Channel的概念和作用,它是否是并发安全的?8、Channel和传统的锁(Mutex)在实现并发控制时有什么区别?各自的适用场景是什么?9、讲一下GMP模型10、当P的本地队列为空或者不为空时,它会怎么去调度G(协程)?11、Redis支持哪些数据结构12、为什么Redis的速度这么快13、如何实现一个类似淘宝搜索框的实时商品名称模糊搜索功能?14、实时输入联想与输入完成后点击搜索在技术实现上有什么本质区别?15、实时搜索通常使用什么网络协议(如WebSocket)?你了解或有使用过吗?讲一下16、请详细说明微信扫码登录的完整流程和背后发生的原理17、在微服务架构中,服务发现和负载均衡是如何实现的?18、服务注册中心(如Nacos, Consul)是如何工作的?服务实例如何注册和保活(如通过心跳机制)?19、讲一下Agent中的“长短期记忆”20、什么样的信息应该放在长期记忆,什么样的信息放在短期记忆?21、当对话轮数很多,上下文窗口不足时,有哪些处理策略?(如截断、压缩)22、如果要进行记忆压缩,通常有哪些方法?23、了解过Agent的设计范式吗?有哪些?24、你设计的Agent是怎么实现ReAct模式的?详细讲讲25、手撕:实现一个并发任务处理器:给定一个包含100个任务ID的列表,要求控制最大并发数为3,模拟并发调用某个外部接口(如打印ID)26、反问
查看24道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务