5.29 淘天大模型应用实习生(50min)

1.自我介绍
2.IOT场景是什么场景,介绍是米家场景,用LLM效果会比较好
3.之前线上用的推荐模型是什么
4.基座模型最后用的是什么,Qwen2.5用Qlora微调时没有出现过拟合情况吗×
5.训练的框架用的是什么×
6.Qwen2.5的框架,GQA,Decoder-only,RMSNorm,位置编码动态
7.Qwen2.5用的是Dense还是Moe×,回答Dense
8.如果用LLM来做分类,用encoder做还是decoder做会好一点×,回答encoder
用Bert做分类的话softmax加在哪一层,加在哪一个维度?×
9.LLM用在推荐系统上,怎么用,用户的历史数据为亿级×回答做不了端到端,但可以做召回和精排
10.LLM适不适合用来做embedding生成?encoder架构还是decoder架构适合?那为什么还要用decoder-only的Qwen来做encoder?
11手撕MOE或LORA
全部评论

相关推荐

01-19 15:14
已编辑
延安大学 C++
累死的一条狗:我说白了这种玩意你直接点举报就完事了在给他挂出来
找工作以来,你最看不惯_...
点赞 评论 收藏
分享
01-14 16:23
广州商学院 Java
双非后端失败第N人:如果准备好了可以直接投字节,字节是最不看学历的,只要想面,大概率都能给你约面。
双非有机会进大厂吗
点赞 评论 收藏
分享
评论
点赞
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务