京东大模型算法实习二面
1. 为什么要用agent解决这个场景
2. 什么是agent
3. 你在里面做了哪些工作
4. 为什么要SFT
5. 训练前后区别在哪 举一个具体的例子
6. 数据怎么构建的
7. 什么平台上训练的 训练多久 学习率多少 为什么是这个学习率
8. 什么是语言模型
9. cnn能不能做语言模型
10. 现在大模型是什么架构
11. 写出伪代码 用abc 预测第四个token 告诉了我特征维度 头个数
12. 分头是怎么分的 怎么拼接
13. 场景题:做一个意图识别的分类任务,类别特别多 怎么做
2. 什么是agent
3. 你在里面做了哪些工作
4. 为什么要SFT
5. 训练前后区别在哪 举一个具体的例子
6. 数据怎么构建的
7. 什么平台上训练的 训练多久 学习率多少 为什么是这个学习率
8. 什么是语言模型
9. cnn能不能做语言模型
10. 现在大模型是什么架构
11. 写出伪代码 用abc 预测第四个token 告诉了我特征维度 头个数
12. 分头是怎么分的 怎么拼接
13. 场景题:做一个意图识别的分类任务,类别特别多 怎么做
全部评论
面的咋样了,不知道年前能不能走完流程
很好奇什么是语言模型啊
相关推荐
八股战士0offer:虽然但是,你想表达的应该是学习如何agent工程里的提示词工程,而不是训练或者微调模型,这基本上是两个不同的方向。我认为学习agent主要就两个东西:提示词工程和上下文工程。像你说的prompt caching这种优化怎么能想到,建议多读大模型供应商尤其是anthropic的博客,anthropic大概一年前就有很详细的博客讲最佳实践和实现了 点赞 评论 收藏
分享
不努力的李狗蛋:刚写完稿子,得知结果。居然过了,我爱你百度。
查看23道真题和解析 点赞 评论 收藏
分享
