03-08 16:35 门头沟学院推荐算法

关注

腾讯多模态算法二面-实习凉经

面试很难，还是要多多练习
1.项目拷打
2.酣畅淋漓的技术八股...
*-讲一下Wan(阿里的通义万相)的框架是什么
*-是否了解MM-DiT的框架
*-对于DiT，时间t是怎么注入的，AdaLN讲一下
*-了不了解VideoVAE是怎么训练的，用了什么损失函数，如果重建视频不清晰可以再加什么Ioss
*-KL散度具体的公式是什么样的?和交叉熵损失函数有什么区别联系
*-是否了解Flowmatching，具体是怎么做的，和DDPM的优劣
*-讲一下Classifier-Free Guidance
*-是否了解视频后训练怎么做的，GRPO是什么
*-你觉得对于训练一个视频基模，应该有哪几个流程，哪一步比较关键
*-训练过多大的模型，用了多少张卡
*-训练过程中是否遇到过不稳定的情况，本质上是因为什么
*-是否了解混合精度，FP16和BF16的区别
*-是否了解大模型训练中的几种并行(DP,PP,TP,EP)
3.手撕: 经典 multi-headattention

全部评论

推荐最新楼层

Yale University 算法工程师

是青云吗

点赞回复分享

发布于 03-24 08:21 美国

03-14 09:54

吉林农业大学算法工程师

科大讯飞 AI Agent开发一面

1、自我介绍2、实习介绍, 遇到过什么困难,有什么提升3、如果现在就是开发的话，一般用什么 IDEPython 开发我一般用 PyCharm 或者 VS Code。如果项目偏工程化、代码量比较大、需要比较强的调试和项目管理能力，我更倾向用 PyCharm，因为它对 Python 项目结构、虚拟环境、断点调试、调用链查看支持比较完整。如果项目需要同时处理前后端、脚本、配置和容器文件，我会用 VS Code，因为插件生态更灵活，远程开发也比较方便。如果涉及服务部署和 Linux 环境排查，我也会结合终端、vim、tmux 一起用。4、项目介绍5、上线后出现 bug，一般怎么处理线上出现 bug 时...

AI-Agent面试实战...

点赞评论收藏

分享

03-11 21:45

门头沟学院机器学习

阿里千问算法实习一面-多模态

继续来分享下之前的面经~欢迎友好讨论，信息共享1.项目细节深挖2.除了caption数据,为什么还要做一些VQA、reasoning、summary数据呢?3.解释为什么VQA、conversation、reasoning数据可能会提升模型效果4.当时的消融实验是完全消融吗?具体怎么做的?5.你的关键帧是怎么做的?6.技术报告看过吗:glm-4.1V,qwen3-vl,mimo-vl,kimi-vl,seed-1.5-vl7.你有仔细去看现在主流的VLM是怎么去洗数据，或者是怎么构造整套pipeline吧8.假如说你参与到这个进程中，你怎么看待接下来的趋势，或者说你拿到一个STEM任务类型，你会怎么去做，你觉得现在技术报告里的缺点在哪里，你有什么想法吗?9.使用VLM-as-judge做整套的数据清洗pipeline，从合成、清洗、过滤、验证、合并，这块有了解吗

查看9道真题和解析

点赞评论收藏

分享

03-21 14:56

门头沟学院 C++

腾讯 PC客⼾端-C++ ⼀⾯

1. 自我介绍2. C++ 中的智能指针都有哪些，分别解决什么问题答案：常见的智能指针主要是 unique_ptr、shared_ptr、weak_ptr，另外还有早期遗留的 auto_ptr，但它已经被废弃。unique_ptr 表示独占所有权，同一时刻只有一个指针拥有对象，不能拷贝只能移动，开销小，最适合所有权明确的场景。shared_ptr 表示共享所有权，多个对象都可以持有同一资源，底层通常有引用计数和控制块，适合多个模块共同管理一个对象的场景。weak_ptr 不拥有对象，只是观察者，通常用来打破 shared_ptr 循环引用，或者在不延长对象生命周期的前提下探测对象是否还活着。工...

C++ 常考面试题总结

点赞评论收藏

分享

03-17 14:15

门头沟学院推荐算法

AI大模型算法，一环扣一环的拷打Transformer 基础详细介绍 Transformer 架构（Encoder-Decoder 结构、位置编码、FFN 等）Decoder 的因果注意力中，Q、K、V 分别来自哪里？→ Q 来自当前 Decoder 输入（已生成的 token 序列），K 和 V 也来自同一序列（需 mask 未来信息）Attention 为什么要 scaled？不做会怎样？为什么是√dₖ？→ 点积随 dₖ增大会让 softmax 进入饱和区，导致梯度消失；除以√dₖ可使方差稳定在 1（数学推导参考 Vaswani 论文）Transformer 如何加速推理？KV Cache 是什么？训练 vs 推理的并行性差异？→ 训练时所有 token 并行计算；推理时自回归，KV Cache 可缓存历史 K/V，避免重复计算，大幅提速多模态论文深挖（以 Video-LLaMA 为例）讲解 Video-LLaMA 的整体结构→ 视频编码器（如 ViT + Temporal Aggregator）→ 投影层（对齐文本空间）→ LLaMA 语言模型论文中 CoT（Chain-of-Thought）的具体设计？→ 在 prompt 中加入推理步骤示例（如 “视频中先看到人挥手，然后狗跑过来…”），引导模型分步作答微调 & 分布式训练微调用了 LoRA，介绍其原理→ 将权重更新 ΔW 分解为低秩矩阵 A×B，冻结原模型，只训练 A、B，大幅减少可训练参数LoRA 初始化怎么做？秩（rank）设为多少？为什么选这个值？→ A ~ N (0, σ²)，B 初始化为 0；常用 rank=8 或 16，在效果和参数量间取得平衡（实验验证）知道 DeepSpeed 和 Megatron 吗？分别说说→ DeepSpeed（微软）：主打 ZeRO 显存优化；Megatron-LM（NVIDIA）：张量并行 + 流水线并行论文用 DeepSpeed，三个 Stage（ZeRO-1/2/3）分别是什么？→ Stage1：优化器状态分片；Stage2：+ 梯度分片；Stage3：+ 模型参数分片（通信换显存）二面下一篇再写吧，力竭了

查看10道真题和解析

点赞评论收藏

分享

03-05 14:23

门头沟学院 C++

字节今日头条-C++ 三面

1. HTTPS 与 HTTP 的区别是什么？在生产环境如何权衡？核心区别： HTTP 明文传输，无机密性/完整性保证； HTTPS = HTTP + TLS，提供加密、完整性校验、身份认证。 工程上要点： TLS 握手有额外开销（CPU、RTT）； 通过 TLS1.3、会话复用、OCSP Stapling、硬件加速可显著优化； 现代互联网服务默认全站 HTTPS，安全收益远大于成本。2.TLS 1.2 vs TLS 1.3 的关键差异？0-RTT 有什么风险？TLS1.3 做了大量“减法与强化”： 删除不安全算法与协商； 1-RTT 完成握手（比 1.2 更快）； 前向安全默认更强。 0-R...

C++ 常考面试题总结

点赞评论收藏

分享

评论

点赞

9

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

2652次浏览 28人参与

# 金融银行求职进展汇总 #

328993次浏览 1785人参与

# 招商银行数字金融训练营 #

42678次浏览 613人参与

# 大厂实习和小厂实习最大的区别是什么？ #

10259次浏览 70人参与

# AI Coding实战技巧 #

1180次浏览 38人参与

# 如果人生可以debug你会改哪一行? #

1854次浏览 48人参与

# 厦门银行科技岗值不值得投 #

11155次浏览 276人参与

# 你都用vibe coding做过什么？ #

1411次浏览 50人参与

# Vibe Coding 会干掉初级岗位吗？ #

3123次浏览 69人参与

# 你见过哪些招聘隐形歧视？ #

1849次浏览 28人参与

# 做完笔试后你收到面试了吗？ #

2887次浏览 40人参与

# 面试被问到不会的问题，你怎么应对？ #

2289次浏览 22人参与

# 牛友の3月总结 #

6701次浏览 63人参与

# 你现在一天AI几次？ #

1006次浏览 38人参与

# 选完offer后，你后悔学本专业吗 #

66447次浏览 262人参与

# 实习学到最有价值的工作习惯 #

66749次浏览 541人参与

# 哪些公司真双非友好？ #

71142次浏览 305人参与

# 七猫笔试 #

5609次浏览 37人参与

# 快手工作体验 #

321230次浏览 2930人参与

# 找AI工作可以去哪些公司？ #

22923次浏览 1006人参与

# 金三银四，你的春招进行到哪个阶段了？ #

26219次浏览 305人参与

# 从事AI岗需要掌握哪些技术栈？ #

18353次浏览 1122人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务