百度大模型算法日常实习一面 1h

继续来分享下最近的面经~
1.实习拷打
2.项目细节
1.基模的可用性,是否进行效果验证和对比
2.意图分类,难意图如何处理
3.数据划分比例 , epoch几个,多少个稳定
4.构建数据参数,一次性还是迭代处理数据
八股
1.为什么选择qwen系列,qwen系列模型的发展 ,RoPE,外推,Attention(GQA和MLA)
2.ppo dpo grpo,做没做过
3.用什么大模型做什么事情,使用场景
手撕
lc300 最大递增子序列
全部评论
手撕只考lc300 算运气不错的
点赞 回复 分享
发布于 今天 12:56 北京
qwen 那块大概率会追问 RoPE 的外推方式
点赞 回复 分享
发布于 今天 11:00 上海

相关推荐

查看20道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务