算法面经1:大模型 金融大哥同花顺

9.1 同花顺 大模型(2+1)🚀
主要是以项目为主,掺杂八股,八股具体如下(忘记顺序是什么样子):
1. Transformer的自注意力机制及相比RNN的优势?
2. 自注意力计算中为何除以 $$\sqrt{d_k} $$?
3. 现在LLM微调的方式有哪些? 再问Adapter和Lora的区别?
4. LLM的架构有哪些?现在使用的是那种?为什么?
5. Prefix LM与Causal LM区别?
6. RLHF流程? 当时不太懂,没深问,现在需要多了解
7. 如何优化大模型训练速度?
8. 跨模态对齐你是如何做的?Q-Former与MLP适配器的优劣。
9. LLM训练中遇到Loss突增如何解决?

#实习# #秋招# #大模型# #nlp# #金融# #算法# #八股#
全部评论
有手撕吗
点赞 回复 分享
发布于 03-16 21:14 湖北
老哥!请问实习是面几轮呀
点赞 回复 分享
发布于 03-16 19:28 上海

相关推荐

9.10面筋,60min1,自我介绍2,狠狠拷打项目,面试官说对你这个项目很感兴趣,详细讲讲。讲一下模型batch_size多大,长序列多长,模型每一层你是怎么写的,怎么训练的,服务器配置,参数设置,架构设计等等,3,深入讲解mamba架构,背景是什么,相比较其他模型有啥特点4,预测类的任务,详细讲接触的loss函数,方法,优缺点,使用场景,指标评价,如何计算。5,说我们主要用的有些transformer架构,包含几种注意力机制并且详细介绍不同,我说三种,然后打断我说我思维混乱😰6,讲解注意力机制,啥时候会梯度爆炸,怎么解决7,自己开发交通agent,做问答决策等。数据量特别少,预料少,专业知识很少😠,你怎么设计架构,怎么优化,怎么做系统。8,数据质量怎么具体提升,工程的具体操作,举一个详细的例子,讲流程,讲解其中步骤的算法等9,你实习怎么做模型训练的10,讲一下你做过最好的项目,背景,难点,自己担任了什么职务,最终指标咋样。11,讲一下实习做的一些业务范畴等12,自己如何真真正正的评测模型的效果,详细讲讲指标怎么来的13,无反问,无手撕,直接结束钉d会议。总体体验不好,另外自己接触独立研发大模型很少,自己做的业务不太相关,同时技术也不够。反思,应该好好专注于目前的阶段,先沉淀几个月,update简历,之后重新准备,复盘提升 相信会好很多,加油!😤😤😤
查看12道真题和解析
点赞 评论 收藏
分享
评论
10
42
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务