猿辅导 ai研发岗

猿辅导
AI研发工程师一面
自我介绍
选择一段经历讲解,我讲了多模态大模型的实习经历
为什么不用PPO,GRPO有那些好处
PPO和GRPO的区别
lora的参数设置都怎么选择的
Tempurature 为 0 的时候会怎么样
KV cache 怎么优化,deepseek的论文有看吗?
Top K P的作用
多轮对话有了解吗?损失函数的构造和单轮有什么不一样
Transformer八股
Embedding 词表为啥是5w,为什么可以覆盖所有的单词和文字
位置编码作用,为什么要有
rope是什么,如何解决长度过长
Qkv ,为啥要有,为啥有三个?不能是两个为什么不能是两个? 
残差的作用,结构
Flash attn
python异步 IO 实现过用过吗
python的GIL
装饰器 生成器,装饰器有啥好处
打开文件为什么要用with
手撕
单向链表 将小于K的结点放在前面,保持相对顺序,不允许使用dummy
反问:
业务,业务当前进度,组内资源,本人后面那些地方需要加强#发面经攒人品# #算法#  #牛客AI配图神器#
全部评论
真人版《让子弹飞》
点赞 回复 分享
发布于 09-28 14:57 黑龙江
看到为什么不能是两个我CPU烧了
点赞 回复 分享
发布于 09-28 14:57 陕西

相关推荐

评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务