长亭科技 大模型 一面

#面试##哪些公司面试官让你印象深刻?##如何判断面试是否凉了##我发现了面试通关密码#
已挂~
10:25 11:00-12:00
面试官挺和蔼的,整体偏向互相交流学习,没答出来的他还说没关系,这是个不断学习的过程。不是压力面真好!

面试内容偏向八股、基础知识,项目和论文问的少。
自我介绍
介绍Transformer
有哪些encoder-only、decoder-only、encoder-decoder结构
介绍BERT(项目、论文、实习里用的都是bert,没用过其他结构)
我目前的研究基本上用BERT+线性层之类的来做,问我LLM出现后分类任务会被取代吗?
BERT、GPT如何分词,有什么区别
常见的位置编码(讲了正余弦位置、可学习参数矩阵、RoPE)
BERT里的可学习参数矩阵来表示位置编码,对于长文本呢》超过这个长度怎么办?
Attention,为什么有Multi-head,作用是什么。BERT里head数是多少,我说bert-base是12,反问为啥是这个数,是基于啥算法得到的还是经验设计的,我猜测是通过实验观察得到
面试官偏向用GPT系列的decoder结构,对BERT这些记不太清了,所以一直在问这方面的内容,我也表示了确实主要用的还是BERT,但目前的大模型也确实都基于decoder架构来做。
介绍项目的收获与其中的难点。
具体想做算法哪方面,一开始没理解还以为是具体的NLP任务场景,我说都可以做,后来又追问,说是偏数据工程还是模型设计还是模型训练,我脑子一抽说了模型设计,面试官反问说模型设计现在基本上没什么可以改进的了,LLM都基本用decoder结构,然后我说这仨我都可以接受,主要是确实都能做啊,也没啥特别喜爱的QAQ
反问,主要业务场景(安全领域的大模型)、需要具备的技能(追踪最新的SOTA、读paper、理解能力、持续学习能力、动手能力、思考能力)

总体来说 还是一场体验感不错的面试,也没有任何刁难,不会的问题面试官也一直说没关系。像是互相在探讨学习的一个过程~
全部评论
请问楼主笔试ac几道进的面
1 回复 分享
发布于 2023-10-31 15:17 上海
请问楼主所有技术类笔试题型都一样吗?全部是编程题么
点赞 回复 分享
发布于 2023-11-08 19:53 吉林

相关推荐

06-06 16:08
已编辑
百度_PGC_前端(实习员工)
极致的基础,极致的三件套,没问小垃圾项目,除了作用域提升的题模模糊糊其他都挺顺的(感觉良好)let const var区别,出了一个简单的作用域相关的题箭头函数和普通函数区别,提到了this指针this指针会指向哪,出了一道简单的this指针相关的题说一下知道的块级元素和行内元素标签dom树长啥样,说一下head和body里面一般有啥标签,说一下语义化标签然后跟着我的回答问了一下:script标签可以放在head里面,defer属性和async属性分别异步到什么时候执行js;提到了语义化可以帮助搜索引擎搜到页面,这个是seo;提到了seo,问知道的seo相关的内容,说了四五种,提到了ssr,说一下ssr和ssg和csr的区别;提到了语义化标签,列举一下知道的语义化标签(面试官帮我补充了meta标签,脑子昏了记成了main标签)说一下闭包,举个例子说一下css方面,display属性有哪些上一问说了none,顺便说了一下visibility:hidden也可以隐藏元素但占据位置,不可交互,问为什么不可交互水平垂直居中怎么实现,说了两种就说可以了position属性属性值说一下说一下知道的原生dom操作,怎么往body下面加一个标签spanbfc知道吗,说了怎么触发,有什么用,解决什么问题react更新状态到渲染的底层机制写题,第一道倒计时组件,自动补全关不掉搞得焦头烂额,换了记事本写isequal,还剩三四行快写完了时间要到了,面试官说他知道我思路了,反问问了一下我面的这个业务方面主要做啥的二编:次日通知过了,约二面
查看34道真题和解析
点赞 评论 收藏
分享
评论
2
27
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务