猿辅导 ai研发岗
猿辅导
AI研发工程师一面
自我介绍
选择一段经历讲解,我讲了多模态大模型的实习经历
为什么不用PPO,GRPO有那些好处
PPO和GRPO的区别
lora的参数设置都怎么选择的
Tempurature 为 0 的时候会怎么样
KV cache 怎么优化,deepseek的论文有看吗?
Top K P的作用
多轮对话有了解吗?损失函数的构造和单轮有什么不一样
Transformer八股
Embedding 词表为啥是5w,为什么可以覆盖所有的单词和文字
位置编码作用,为什么要有
rope是什么,如何解决长度过长
Qkv ,为啥要有,为啥有三个?不能是两个为什么不能是两个?
残差的作用,结构
Flash attn
python异步 IO 实现过用过吗
python的GIL
装饰器 生成器,装饰器有啥好处
打开文件为什么要用with
手撕
单向链表 将小于K的结点放在前面,保持相对顺序,不允许使用dummy
反问:
业务,业务当前进度,组内资源,本人后面那些地方需要加强#发面经攒人品# #算法# #牛客AI配图神器#
AI研发工程师一面
自我介绍
选择一段经历讲解,我讲了多模态大模型的实习经历
为什么不用PPO,GRPO有那些好处
PPO和GRPO的区别
lora的参数设置都怎么选择的
Tempurature 为 0 的时候会怎么样
KV cache 怎么优化,deepseek的论文有看吗?
Top K P的作用
多轮对话有了解吗?损失函数的构造和单轮有什么不一样
Transformer八股
Embedding 词表为啥是5w,为什么可以覆盖所有的单词和文字
位置编码作用,为什么要有
rope是什么,如何解决长度过长
Qkv ,为啥要有,为啥有三个?不能是两个为什么不能是两个?
残差的作用,结构
Flash attn
python异步 IO 实现过用过吗
python的GIL
装饰器 生成器,装饰器有啥好处
打开文件为什么要用with
手撕
单向链表 将小于K的结点放在前面,保持相对顺序,不允许使用dummy
反问:
业务,业务当前进度,组内资源,本人后面那些地方需要加强#发面经攒人品# #算法# #牛客AI配图神器#
全部评论
相关推荐

点赞 评论 收藏
分享