美团春招-机器学习算法-面经
一面 3.21
问项目:问了一个项目,问的非常详细,大概问了30min
然后问基础:
transformer的架构
为什么使用multi-head、残差链接和前馈神经网络层
梯度消失的原因是什么
gpt和t5的区别
bert和t5的区别
了解现有的大模型,比如LLaMa这些吗
代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
问项目:问了一个项目,问的非常详细,大概问了30min
然后问基础:
transformer的架构
为什么使用multi-head、残差链接和前馈神经网络层
梯度消失的原因是什么
gpt和t5的区别
bert和t5的区别
了解现有的大模型,比如LLaMa这些吗
代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
全部评论
佬的项目是什么呀
手写测试用例吗
佬,请问是什么业务方向呀
相关推荐
05-24 18:04
Université d’Auvergne-Clermont-Ferrand 1 C++ 点赞 评论 收藏
分享
点赞 评论 收藏
分享
04-21 21:01
广东工业大学 Java 点赞 评论 收藏
分享

点赞 评论 收藏
分享
05-28 18:09
门头沟学院 Java 点赞 评论 收藏
分享