百度大模型算法日常实习一面 1h
继续来分享下最近的面经~
1.实习拷打
2.项目细节
1.基模的可用性,是否进行效果验证和对比
2.意图分类,难意图如何处理
3.数据划分比例 , epoch几个,多少个稳定
4.构建数据参数,一次性还是迭代处理数据
八股
1.为什么选择qwen系列,qwen系列模型的发展 ,RoPE,外推,Attention(GQA和MLA)
2.ppo dpo grpo,做没做过
3.用什么大模型做什么事情,使用场景
手撕
lc300 最大递增子序列
1.实习拷打
2.项目细节
1.基模的可用性,是否进行效果验证和对比
2.意图分类,难意图如何处理
3.数据划分比例 , epoch几个,多少个稳定
4.构建数据参数,一次性还是迭代处理数据
八股
1.为什么选择qwen系列,qwen系列模型的发展 ,RoPE,外推,Attention(GQA和MLA)
2.ppo dpo grpo,做没做过
3.用什么大模型做什么事情,使用场景
手撕
lc300 最大递增子序列
全部评论
手撕只考lc300 算运气不错的
qwen 那块大概率会追问 RoPE 的外推方式
相关推荐
查看22道真题和解析 点赞 评论 收藏
分享
美团公司福利 3664人发布