淘天大模型面经

1. 介绍自己的项目
2. LLaMA和GLM的区别,模型架构等方面
3. BLEU和ROUGE
4. 数据量和这个效果之间的关系是什么样的
5. LLM的参数介绍(temp topk top p等)
6. 长度过长怎么处理,从是否fix原有模型回答。(BPE 扩展词表,分阶段generate)以及从input直接回答
7. PEFT的方式
8. data construction的tricks
6. 淘天客服部门
1. LLM generate 参数问题
2. slef-attention得根号d
3. LLM的评估
4. 介绍下simCSE
5. 解决tokens不够的问题应该怎么办
6. 详细介绍下deepspeed(三个stage结合参数回答)
7. gpt和llama的区别(模型结构上的)
8. LORA论文讲一下,对比p-tuning
9. LLM训练的时候为什么warmup
pretrain数据量大,前面的数据量占比小,可能带来bias
参数量大,初始化的时候w是随机的,防止爆炸
10. 对比学习中的batch size是大一些好还是小一些好->大一些,甚至可以到10k+,为了构造好的negative样本
11. coding:
给你一个数组,返回其中的前k个出现频率最高的元素,假设数组特别大,k很小
全部评论

相关推荐

点赞 评论 收藏
分享
昨天 19:10
门头沟学院 Java
1.描述过往项目中印象最深的问题及解决过程2.秒杀活动中如何评估数据库支持的最大并发量?3.提到Redis缓存库存,如何评估数据库与Redis的并发支持能力(如QPS值)?4.磁盘读取数据时,如何通过磁道地址定位数据?磁道寻址的时间成本如何?5.磁盘旋转一圈的时间大约是多少?6.为什么选择Redis而非本地内存实现缓存?7.Redis的高可用性具体如何体现?8.主从模式下,主库与从库如何同步数据?同步延迟如何处理?9.主备模式下,从库读取数据可能出现脏读,如何平衡高可用性与数据一致性?10.秒杀场景中使用Redis的持久化机制的必要性?11.秒杀中使用的什么数据结构?我不会就说哈希脑子也是抽了12.为什么在秒杀中使用哈希数据结构?具体解决了什么问题?13.MyBatis与Redis结合使用的场景14.MyBatis缓存是否了解?是否了解MyBatis的二级缓存机制?如何与Redis集成实现分布式缓存?15.消息队列的持久化配置是否确认过?默认存储位置是内存还是磁盘?16.如何理解跨域问题17.基于TCP协议的网络通信中,如何实现超时控制?主调侧如何检测超时?18.描述DNS寻址流程19.DNS缓存可能导致脏数据,如何更新域名解析记录(如A记录变更后的全网同步)20.TCP协议中,超时重传机制的具体实现(如重传计时器、ACK确认)21.MySQL的查询缓存(Query Cache)机制是否了解?与Redis缓存的区别?22.对比Redis与本地内存的差异,除持久化外还有哪些选择依据?23.Redis的AOF和RDB持久化机制的区别?如何选择适用场景?24.主备模式下,备节点是否支持读操作?默认配置下的读写策略是什么?25.项目中使用的消息队列是否考虑过数据丢失风险?如何保证可靠性?
查看25道真题和解析
点赞 评论 收藏
分享
评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务