AI infra独角兽公司一面

1. 当训练推理卡规模倍增的情况下,最容易产生瓶颈的位置可能是什么
  a. 请展开分析产生的原因
  b. 对于此类问题,有什么优化或者缓解方案
2. 请解释并介绍一下 Roofline 模型,如何判断性能已经达到计算瓶颈
3. 在 C++中,若数组越界写使得其他的数据结构被写坏了,工程现场保留了 coredump 文件,你应该如何排查这个错误
4. 请介绍一下你理解的 Flash-attention
5. 当进行 GEMM 计算时,一定可以保证它是一个计算瓶颈算子吗,如果要你去优化它,你的思路是什么。
6. 对于性能优化的定位和瓶颈的检测,你有什么方法吗
7. 手撕:手写包含 GQA 的 attention 模块实现

#面经##infra#
全部评论
佬面的是minimax吗?怀疑我们碰到了一个面试官,第三题他也问过我。后续我二面挂了
2 回复 分享
发布于 2024-08-28 00:09 上海
佬,请问ai infra怎么入门呀,研0在纠结ai infra和搜推中
点赞 回复 分享
发布于 02-11 23:47 山东
我测是真难啊 佬现在有拿到offer了嘛
点赞 回复 分享
发布于 2024-11-19 17:23 北京

相关推荐

不愿透露姓名的神秘牛友
07-24 13:39
在记录秋招的大魔王很...:别被忽悠了,我做了多年销售。我可以告诉你,这就是忽悠你的,销售一定要看底薪也要看提成两者不可缺一。提成是有业绩的时候才拿的到的,谁能保证一直有单状态都好。销售有时候很讲究运气的。底薪是你这个人这个岗位日常工作体现的价值。别小看底薪,你看那些跳槽去做经理主管的,底薪底一些,人家愿意去吗?所以那些说销售靠提成的纯属忽悠,除非他们的业务很容易成单。
点赞 评论 收藏
分享
太难了,双9bg也被刷
投递韶音科技等公司10个岗位
点赞 评论 收藏
分享
评论
5
29
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务