文远知行 26校招凉经

很珍惜和L4的公司交流的机会,wenyuan的面试也确实是近期强度最大的之一。

我应该是最早面一面的一批了,之后又隔了很久约上二面,还是没有在拷打中存活下来。两面都是从项目出发聊,从数据到模型到训练全方位问一遍,也会问相应涉及到的基础知识,最后写一道题。

一部分被问到的问题包括:

CLIP相关:
1. 为什么用余弦相似度,而不是L1或L2
2. 损失函数的公式
3. 如果要将focalloss的思想引入,应该怎么设计

Transformer相关:
1. 注意力
2. ViT怎么将注意力用于视觉
3. 如何处理变长输入
4. 位置编码的过程,图像patch的位置如何做位置编码

手撕 一次是lc中等题(矩阵的最大得分),一次似乎不是原题不过比较简单
#发面经攒人品#

------ 如果有帮助的话求佬们点一下送花 ------
全部评论
第1个问题的回答思路是什么呀
点赞 回复 分享
发布于 09-04 10:47 湖南

相关推荐

11-08 16:10
门头沟学院 Java
1. 介绍实习工作2. 面试官让我言简意赅地回答,不要展开太详细,主要要围绕你针对什么问题,做了什么事,实现了什么效果3. PD分离部署是什么意思,为什么能够提高吞吐量(实习)4. 面试官主要想听到,prefill阶段是计算密集型任务,decode是内存密集型任务5. 模型服务部署成功后,用户输入一个信息,在PD分离部署下数据链路是怎么样的6. 项目里写的定义的监听器为了保证数据的一致性,这里的数据一致性是指什么数据,他们为什么会不一致,是如何同步的7. K8S的pod之间是如何通信的8. docker的原理,它和传统的虚拟机有什么区别,它有什么优势9. 项目里写了优化数据库和缓存,是如何优化的10. 为什么要建覆盖索引11. 什么场景下会建立覆盖索引,建立了覆盖索引为什么速度更快12. 索引表里面会存数据吗?13. mysql的底层数据结构是什么?14. 为什么要用B+树不用其他数据结构15. redis的I/O多路复用16. ip和tcp协议的作用17. tcp协议是如何保证数据的可靠传输的18. 重点不在三次握手,握手只是方式,要答序列号同步、确认机制类似的这些19. tcp包的序号是如何定的,比如我有一个很大的包,分成了50份,这50个数据包是如何编号的20. 手撕一个计算器,输入一个字符串,输出答案,字符串只包含括号和+、-
查看17道真题和解析
点赞 评论 收藏
分享
评论
3
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务