2024-11-28 21:04 已编辑仙台白百合女子大学嵌入式工程师发布于山东

关注

小米具身智能算法岗实习一面

第一个帖子给第一次面试，攒攒人品。
课题：强化学习和模仿学习怎么在任务里结合的，为什么要用这两个。模仿学习收集数据怎么收集。强化学习奖励函数的设置，以及需要多少次迭代。末端力如果有噪声怎么办。实体的强化学习效果怎么样。对大模型有没有了解。对Serl有没有了解。
竞赛：在竞赛中承担什么样的角色做了什么工作。
八股：model-base和model-free的区别，马尔可夫性解释，为什么最优值函数就是最优策略，策略迭代和值迭代区别。
代码：合并区间。

感受：虽然迟到了但是面试官非常温柔，而且问的也很对口，就是我很容易说别的废话呜呜呜，第一次面试函数名用了拼音，写的时候感觉就不太好但是突然脑子里没有英文名。

hr建议：多跟进最新进展成果，不要专注于两三年前的东西。

如果有会大模型的也建议投一下，面试官说那边比较缺人。

##小米机器人##小米求职进展汇总##面试##小米##强化学习##模仿学习##大模型##牛客创作赏金赛##实习#

全部评论

推荐最新楼层

清华大学深度学习

coding大概考了什么内容呢

1 回复分享

发布于 2024-12-02 19:52 北京

等一个offer的灰太狼很emo

中国地质大学（武汉）算法工程师

机器人事业部吗？

1 回复分享

发布于 2024-11-30 00:31 湖北

门头沟学院算法工程师

进了吗

点赞回复分享

发布于 2024-12-09 21:03 上海

03-25 18:31

门头沟学院 FPGA工程师

具身智能面试题

DDPM 和 DDIM 的区别是什么？ 第一步：前置小知识（重参数化技巧） 在扩散模型中，我们最常用到一个技巧：如果你有一个符合正态分布的变量 （均值为 ，方差为 ），我们可以把它拆成：  这里的  是一个标准正态分布的纯噪声 。 直白点说： 任意状态 = 确定的基础值 + (随机噪声  噪声强度)。记住这个公式，它是贯穿整个推导的灵魂。 第二步：DDPM 的基础设定（从头到尾加噪） 在原来的 DDPM（去噪扩散概率模型）中，我们有一个清晰的正向加噪过程。 假设我们有一张清晰的图像（或者机器人的一个完美动作），叫做 。我们在它上面不断加噪声，加到第  步时，它变成了 。 DDPM 证明了一个极...

点赞评论收藏

分享

03-26 09:36

复旦大学 C++

值得投递的AI公司清单 + 核心理由

阿里：通义实验室 / 千问事业部（大模型基座 + 多模态）、AI Agent 优化岗（新增核心方向）理由：AI 岗占比超 80%，覆盖全技术链，实习转正率高，通义大模型落地场景丰富。腾讯：AI 工程架构 / 大模型应用（多业务线渗透）理由：技术扩招 36%，AI 场景覆盖社交、云、游戏，工程化能力突出。蚂蚁集团：AI 搜索 / 具身智能 / AI 安全理由：技术岗占 85%，70% 为 AI 岗，聚焦大模型与产业落地，生态资源独特。智谱 AI：大模型全流程研发（背靠清华 KEG 实验室）理由：GLM 模型口碑出圈，能参与数据清洗到 RLHF 全流程，技术氛围纯粹。百川智能：中文大模型优化（王小川领衔）理由：融资到位，中文场景落地能力强，兼顾技术打磨与商业化。深势科技：AI + 生物医药 / 材料（AI for Science 标杆）理由：细分赛道领跑，用 AI 加速科研，技术创新性强。

找AI工作可以去哪些公司...

点赞评论收藏

分享

03-25 18:29

门头沟学院 FPGA工程师

具身智能面试常见题

1. 必须熟悉 DDPG 、 PPO 、 TD3 、 SAC 等算法的原理和区别。 这四种算法是连续控制（如机器人控制）中最常用的深度强化学习算法。 PPO (Proximal Policy Optimization)   原理：PPO是一种同策略（On-policy）的策略梯度算法。它使用截断（Clipping）机制限制新旧策略的更新步长，防止策略更新“翻车”。   核心公式：    数值计算示例： 假设在时间步 ，GAE计算出的优势函数 （正数，说明这个动作很好）。 设定截断超参数 。 如果新网络过于激进，导致新旧策略概率比 （新策略采用该动作的概率是旧策略的1.5倍）：   原始目标： ...

点赞评论收藏

分享

03-26 08:40

门头沟学院人工智能

腾讯具身智能一面-难死我了

攒攒人品！ 1.项目拷打2.vision-language 对齐是 joint embedding 的？，那做了哪种对齐？有做 hard negative mining 吗3.所有视角共享 encoder 吗？如何防止view collapse？4.semantic space是如何保证cross-modal consistency的5.用diffusion model做动作策略，是怎么建模action space的6.如果多个diffusion模型组合，用了 gating 机制还是 uncertainty-aware ensemble？那 uncertainty 是怎么量化的？有对比过 epistemic 和 aleatoric 吗？7.怎么防止action drift？有没有引入 consistency regularization或者temporal smoothness loss？8.在surgical robotics里policy failure cost 很高，是怎么做risk-aware training 的？有没有加入 CVaR loss10.模型泛化能力是靠数据多样性还是结构归纳偏置？能列出你设计中的 inductive bias 吗？对 unseen 手术任务怎么泛化11.surgical scene 变化很大，怎么办12.你说MAE 是做关键帧 reconstruction，那帧选择怎么做？具体打分逻辑是怎么样的13.有没有做 token-level saliency analysis？你怎么知道模型真的关注了 surgical tool 而不是 background？部署是在 ARM 上还是 X86？有没有模型并行？多线程和多进程各负责什么14.做多模态感知融合时，视觉、语言、触觉（如果有）延迟不同，怎么对齐的15.整个pipeline的E2E latency是多少？瓶颈在哪你说中间用了 LQR，你 gain matrix 是 constant 吗？有没有做 gain scheduling？基于什么指标调的16.控制系统稳定性你怎么保证？有没有做过 Lyapunov 函数证明17.做过 trajectory optimization 吗？是基于 collocation 还是 direct shooting18.假设你有个 policy 输出波动很大，你会考虑在 policy 层加高通滤波器还是在 loss 层加 penalty？为什么？19.diffusion policy 是连续动作空间，那你是建模 joint distribution 还是 marginal20.语言指令不是 deterministic 的，你们是直接用 language embedding 吗？有没有考虑language-conditioned latent variable model？

查看21道真题和解析

点赞评论收藏

分享

03-25 09:19

门头沟学院 Java

AI工作保姆级清单

刷到这个话题必须来波硬货，前前后后研究了上百家公司，把2026年值得冲的AI公司，按梯队整理成了完整清单，从大厂到独角兽，从通用赛道到垂直领域，应届生、实习生、转行党全适配，找AI工作的牛友直接抄作业！第一梯队：全栈AI巨头｜平台大、资源足、抗风险能力拉满这一档是国内AI全产业链布局的绝对龙头，技术沉淀深、业务场景全、校招体系完善，适合想稳扎稳打、系统成长的应届生，也是AI行业的硬通货。字节跳动核心AI方向：豆包大模型、AI Agent、多模态AIGC、AI安全、火山引擎AI基础设施推荐理由：国内C端AI用户规模最大的厂商，豆包生态已经形成完整闭环，AI相关岗位占比超90%，校招hc充足，薪资...

找AI工作可以去哪些公司...

点赞评论收藏

分享

评论

9

31

招聘动态

百度

2027届暑期实习

招商银行数字金融训练营

火热报名中

米哈游2026校园招聘

应届生春招&全年实习生专项

新华三

2026届春季校园招聘

联想

27届暑期实习

奥克斯集团

2026春季校园招聘

厦门银行

2026届春季校园招聘

联想

26届补录

携程集团

2026年春季校园招聘

27届校招宝典

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 大厂实习和小厂实习最大的区别是什么？ #

8158次浏览 55人参与

# 你都用vibe coding做过什么？ #

1054次浏览 38人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

20825次浏览 395人参与

# 如果人生可以debug你会改哪一行? #

1343次浏览 38人参与

# Vibe Coding 会干掉初级岗位吗？ #

2357次浏览 53人参与

# 做完笔试后你收到面试了吗？ #

2303次浏览 32人参与

# 招商银行数字金融训练营 #

42190次浏览 607人参与

# AI Coding实战技巧 #

833次浏览 28人参与

# 你见过哪些招聘隐形歧视？ #

1364次浏览 21人参与

# 牛友の3月总结 #

5655次浏览 53人参与

# 你现在一天AI几次？ #

873次浏览 35人参与

# 哪些公司真双非友好？ #

70982次浏览 305人参与

# 找AI工作可以去哪些公司？ #

21657次浏览 971人参与

# 从事AI岗需要掌握哪些技术栈？ #

17675次浏览 1081人参与

# 4399求职进展汇总 #

58870次浏览 242人参与

# 金三银四，你的春招进行到哪个阶段了？ #

25923次浏览 302人参与

# 如果可以选，你最想从事什么工作 #

763974次浏览 4895人参与

# 你做过最难的笔试是哪家公司 #

53400次浏览 978人参与

# 你觉得技术面多长时间合理？ #

176575次浏览 1204人参与

# AI面会问哪些问题？ #

40862次浏览 1296人参与

# 说说你知道的学历厂 #

391213次浏览 1381人参与

# 中国电信笔试 #

33584次浏览 308人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务