当代青年摆烂一级选手

03-11 21:45 门头沟学院机器学习

关注

阿里千问算法实习一面-多模态

继续来分享下之前的面经~欢迎友好讨论，信息共享
1.项目细节深挖
2.除了caption数据,为什么还要做一些VQA、reasoning、summary数据呢?
3.解释为什么VQA、conversation、reasoning数据可能会提升模型效果
4.当时的消融实验是完全消融吗?具体怎么做的?
5.你的关键帧是怎么做的?
6.技术报告看过吗:glm-4.1V,qwen3-vl,mimo-vl,kimi-vl,seed-1.5-vl
7.你有仔细去看现在主流的VLM是怎么去洗数据，或者是怎么构造整套pipeline吧
8.假如说你参与到这个进程中，你怎么看待接下来的趋势，或者说你拿到一个STEM任务类型，你会怎么去做，你觉得现在技术报告里的缺点在哪里，你有什么想法吗?
9.使用VLM-as-judge做整套的数据清洗pipeline，从合成、清洗、过滤、验证、合并，这块有了解吗

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

千问就来面试了吗

点赞回复分享

发布于 03-12 21:34 北京

03-04 22:29

门头沟学院算法工程师

影石多模态大模型算法工程师一面面经攒人品

社招第一次面试手撕了这么多代码.....太硬核了！基操：项目做的是什么？你训练算法过程中一般用哪些损失函数？中途插入问题：qwenvl系列的模块设计由哪些部分组成？然后就直接开始手撕代码了：多模态输入、Token 处理、Self/Cross Attention、Mask、LoRA、Dataset/DataLoader、训练流程、累计梯度、eval、多进程通信、微调方法 全都要会写代码。多模态大模型算法岗 · 高频面试题 + 标准答案（完整版）1. 多模态模型（图文）输入是怎么 Tokenize 的？答：文本用文本分词器转成文本 Token。图片不直接分词，而是切成固定大小的 Patch，每个 ...

查看20道真题和解析

点赞评论收藏

分享

03-08 16:35

门头沟学院推荐算法

腾讯多模态算法二面-实习凉经

面试很难，还是要多多练习1.项目拷打2.酣畅淋漓的技术八股...*-讲一下Wan(阿里的通义万相)的框架是什么*-是否了解MM-DiT的框架*-对于DiT，时间t是怎么注入的，AdaLN讲一下*-了不了解VideoVAE是怎么训练的，用了什么损失函数，如果重建视频不清晰可以再加什么Ioss*-KL散度具体的公式是什么样的?和交叉熵损失函数有什么区别联系*-是否了解Flowmatching，具体是怎么做的，和DDPM的优劣*-讲一下Classifier-Free Guidance*-是否了解视频后训练怎么做的，GRPO是什么*-你觉得对于训练一个视频基模，应该有哪几个流程，哪一步比较关键*-训练过多大的模型，用了多少张卡*-训练过程中是否遇到过不稳定的情况，本质上是因为什么*-是否了解混合精度，FP16和BF16的区别*-是否了解大模型训练中的几种并行(DP,PP,TP,EP)3.手撕: 经典 multi-headattention

点赞评论收藏

分享

03-14 17:42

湖南农业大学测试工程师

三个月内，从机器学习小白直接到面试实习

我曾经也是机器学习纯小白，对算法一窍不通，甚至连Python都只会简单的print语句，一度以为“AI领域的面试实习”是遥不可及的事情。后来我制定了一套精准的三个月计划，不盲目啃书、不囤积资料，只抓核心、重实战，三个月后顺利拿到3家公司的机器学习面试实习邀约，甚至成功拿到offer。这篇文章，我会把自己亲测有效的三个月计划，毫无保留分享给你——不用天赋、不用每天熬8小时，每天1-2小时，跟着走，从ML小白，一步步具备面试能力，真正实现“三个月直接面试”。全程不玩虚的，没有晦涩术语，每一步都有明确目标、具体任务，新手照着执行，就能少走90%弯路。⚠️ 先避坑：小白最容易犯的3个错误在开始计划前，...

点赞评论收藏

分享

02-28 03:30

门头沟学院产品经理

阿里千问AI创作产品面经-Agent方向

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流1、你如何把"模型能力演进"拆成一张可执行的效果策略路线图，并做价值判断?(请用你主导过的一个真实项目举例:从机会识别策略拆解落地方案上线验证)2、给定业务目标:把视频AIGC做成"可规模化使用"的生产力工具，你会如何定义'效果'而不是'"炫技"?3、你如何把"模型可调用能力(API参数/上下文等)"转成产品可控的效果杠杆?(以一次你做过的参数/链路设计为例)4、当模型持续迭代带来"质量波动/回归"，你如何设计效果守护与灰度机制?5、假设你要做电商广告:文生视频/图生视频，强调多镜头叙事与15s成片。你会如何定义上线可用的效果目标与红线?6、"多镜头&智能分镜调度"这种能力，你如何拆成模型侧与产品侧的交付边界?7、你会如何设计'人物一致性/音色一致性/多人物稳定性'的指标与评测方法?8、从0到1做视频AIGC:你如何设计"离线评估线上实验用户采纳复盘迭代"的闭环?9、视频生成常见范式包括:文生视频、首帧/首尾帧、多图生视频、图+音频口型等。若你做"一键短视频生成"产品，你如何选择能力组合与迭代顺序?10、算法团队说:'先做参考生视频保证一致性'，业务团队说:'先做文生视频追求多样性与创意爆款'。你如何做决策并对齐里程碑?11、假设你要做"视频创作Agent"，你会如何划分:规划、工具调用、生成、剪辑编排、验收?12、你如何判断一个需求应该做Agent(自主决策)还是工作流(确定性步骤)?13、你如何为Agent设计"效果评估指标"，既覆盖任务成功率，也覆盖创作质量与用户信任?14、请你设计一套"生成类能力效果质量评估标准"的三层体系:模型目标效果、训练过程质量、用户体验指标。要求能作为算法迭代的Gate。15、上线后采纳不达预期:你如何复盘并证明问题出在"效果不足"还是"产品路径/成本/时延/心智"导致?

点赞评论收藏

分享

03-19 20:04

阿里巴巴_基础产品事业部_技术专家

阿里云三个技术开发职位推荐，欢迎扫码，Data+AI

帮你内推｜阿里云校招

点赞评论收藏

分享

评论

1

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 跟HR说什么能被秒回？ #

10599次浏览 183人参与

# 职能管理面试记录 #

9347次浏览 45人参与

# 巨人网络春招 #

10322次浏览 164人参与

# 春招/暑实第一面是哪家？ #

21752次浏览 241人参与

# OPPO求职进展汇总 #

790381次浏览 5420人参与

# 你收到了哪些公司的笔试？ #

19794次浏览 112人参与

# MiniMax求职进展汇总 #

16283次浏览 243人参与

# 正在春招的你，也参与了去年秋招吗？ #

359491次浏览 2612人参与

# 一人说一个提前实习的好处 #

115335次浏览 704人参与

# 京东美团大战，你怎么看？ #

174481次浏览 883人参与

# 京东开奖 #

673848次浏览 3238人参与

# 如何一边实习一边找下家？ #

34267次浏览 247人参与

# 面试官最爱问的 AI 问题是...... #

18199次浏览 614人参与

# 你的嫡系AI是哪个？ #

4923次浏览 119人参与

# 现在入门AI应该走哪些方向？ #

4953次浏览 101人参与

# 把自己当AI，现在最消耗你token的问题是什么？ #

3439次浏览 95人参与

# 想给25届机械人的秋招建议 #

46227次浏览 247人参与

# 26届秋招公司红黑榜 #

80443次浏览 280人参与

# 阿里巴巴工作体验 #

27046次浏览 61人参与

# 实习生如何通过转正 #

130134次浏览 1477人参与

# 巨人网络工作体验 #

74286次浏览 505人参与

# 巨人网络求职进展汇总 #

190823次浏览 1228人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务