阿里国际AI应用算法面经分享

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.项目拷打

2.实习相关八股:
1.业务场景
2.sft数据如何筛选和采样 有哪些处理
3.为什么选取GRPO 优化目标是什么 GRPO的数学原理
4.奖励函数如何设计(重点拷问)
5.如何判断模型强化学习训练过程中训练质量达到要求
6.有没有出现reward hacking
7.除了这种碰巧式的奖励作弊外还有其它的奖励作弊吗
8.了解ppo和dpo吗(开始吟唱)

3.其它八股:
1.attention计算时间复杂度
2.kv cache 原理
3.gqa mla 原理
4.vllm原理
5.flash attention原理
6.稀疏注意力原理
7.如果模型推理比较慢如何排查

4.coding
rand7()表示rand10()
给定浮点数组通过向上取整和向下取整构造目标整数 求最小变化之和
最长无重复子串
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务