高德地图 算法 二面面经

一小时,拷打transformer
你怎么理解AIGC?
讲一下transformer
transformer和cnn的区别
transformer中embeding怎么做的
位置编码你了解哪些形式
三角函数位置编码有哪些好处,旋转位置编码呢
position embeding 和input怎么融合的
多头注意力相比单头优势,encode的时候多头会做融合吗?还是什么时候做融合?
拆成多少个头有什么规律吗?
之后的层归一化怎么实现的
前馈神经网络有几层,为什么要用mlp这种结构?
像gpt和图像生成,大都是decoder-only架构,为什么
xl参数量多少
相比于传统的模型和思路方法,为什么能达到现在这个效果,以及你怎么看待它未来的发展。
多模态模型了解哪些?
无手撕
#阿里##算法##面经##如何判断面试是否凉了##秋招#
全部评论
还挺,朴实的
1 回复 分享
发布于 2024-09-03 20:41 天津
根本答不出来
1 回复 分享
发布于 2024-09-01 03:15 浙江
大佬面的哪个岗位or部门哇~
点赞 回复 分享
发布于 2024-10-20 02:45 北京
佬蹲蹲后续
点赞 回复 分享
发布于 2024-09-27 17:23 上海
attention 拆成多少个头有什么规律吗? 请问这个有说法吗?不会
点赞 回复 分享
发布于 2024-09-23 13:23 美国
佬,XL是哪个啊?
点赞 回复 分享
发布于 2024-09-01 17:54 陕西
佬有论文吗?
点赞 回复 分享
发布于 2024-09-01 11:02 北京
太细了
点赞 回复 分享
发布于 2024-09-01 10:46 北京

相关推荐

04-15 01:50
门头沟学院 Java
整体面试还是不错的,但是没后续了,不知道是哪里出了问题1.实习拷打2. double 处理金额会发生什么问题?通常用什么来替代 double?3. 字符串怎么转成字节数组?在 Java 中默认编码是什么?4. 一个英文字符占多少位?中文占多少位?5. 创建 MySQL 数据库的编码utf8mb3 和 utf8mb4 有什么区别?6. 有在工作中处理过 emoji 表情字符吗?怎么去存储表情在数据库中?7. 字符串拼接用 + 号和用 StringBuilder 有什么区别?8. 遍历 List 的过程中,根据条件删除元素的正确操作是什么?(注:不能使用 list 本身自带的 remove,要用迭代器的 remove)9. 初始容量为 4 的 ArrayList,放 10 个元素会发生几次扩容?10. 假设有一个对象包含一个非静态的 private 方法,如何通过反射调用它?需要哪几步操作?11. 8G 内存的机器跑一个 Java 常驻进程,你会怎么分配堆内存和元空间?设置哪几个参数比较好?12. 假设是一个需要用到 NIO 的 Netty 之类的一些框架的一个程序,出现操作系统把 Java 程序杀掉的情况,该从哪些方面怎么排查?(答了内存、cpu、日志三个方面)13. 如果死前内存占用 97%,死后降至 15%;死前 CPU 占用仅 20%-30%,这是发生了什么?(答了可能出现了循环创建等情况)14. Java 循环创建会先把分配好的堆内存打满吗?请描述从开始循环创建到进程被杀死的整个流程。15. 静态对象或变量会出现循环创建吗?16. 在上述内存打满、CPU 较低的场景中,会有大量的 Full GC 吗?为什么?(不会,因为 Full GC 会使 CPU 占用过高)17. 操作系统判定进程资源使用不合理将其干掉,去哪看系统底层日志?
查看16道真题和解析
点赞 评论 收藏
分享
评论
23
109
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务