关于这个方向怎么学啊佬,想转大模型部署这个方向
2 7

相关推荐

05-10 11:05
已编辑
中国科学技术大学 Java
打个岔:欢迎佬前往这条帖子下 https://www.nowcoder.com/feed/main/detail/8ee8e7d5577f4d9ebd9ad72367b14f73?sourceSSR=users,给点建议。打岔完毕。  面了好几次腾讯,感觉由于我是java选手,腾讯的第一轮技术面试往往会问你会不会C++/go,八股也偏向于问计网、系统(特别是线程、携程、进程这块),而且会深挖,但把小林code好好看看应该也没啥大问题。去年腾讯暑期实习时,腾讯会一直捞,所以刷了好几次面经(都是面后凭记忆写的)4.11 腾讯 一面三道题(30 min + 解题思路 20min)1. 在非递减数组中找 target 的起始和结束位置2. 层次遍历3. 最长严格递增子序列问项目拷打项目高可用,秒杀时如何确保redis和mysql数据一致秒杀完,发异步消息时,rabbitmq宕机了怎么办?八股进程线程、系统调用的具体过程对比 B+ 树 和 二叉搜索树你的项目中用到了什么索引4月17 腾讯视频 一面第一题,翻转单链表,20分钟解决,面试官问能不能只用一次循环就解决,没想出来第二题,二叉树中序遍历,非递归版,没写出来,但讲了思路第三题,上楼梯,每次一步或两步,经典递归或动态规划mysql 相关有哪些索引?事务的隔离级别项目相关请求特别多时,都打到redis上,redis怎么扛得住?   我提到限流之类的,最后面试官给出的答案,redis集群4月22 腾讯视频 二面上来先问了十几分钟科研相关c++相关:指针和引用?   数据库相关:一张表 有 a、b、c 三个字段,select b,c from table where a = 1; 问会怎么加锁?一个 mysql 请求大概要多长时间?负载均衡,一致性哈希? 秋招的时候腾讯广告部门捞了我一次,但答得不是很好(所以就忘记写面经了)春招时又被捞了4月17 腾讯视频 一面算法题从0实现堆排序(需要太多时间,后面换题了)快排单链表判断环超过半数的数字(摩尔投票)c++还记得吗?虚拟内存,为什么要用虚拟内存?虚拟内存中包含哪些部分进程和线程,进程通信方式?(套接字,共享内存,管道)管道怎么实现的?共享内存怎么实现的?java有携程吗?java里多线程并发怎么实现?(锁,乐观,悲观锁)网络编程了解过吗?代码大致怎么写?磁盘文件到用户有几个缓冲区?I/O多路复用?tcp第三次握手丢失了会怎样?客户端还能向服务器发请求吗?(能,但服务端回应的还是第二次握手)如果很多客户端都不发第三次握手很怎么样?(提示:服务端有最大连接数,达到最大连接数会拒绝吗)四次挥手time_close,wait_close?4月24 腾讯云 拷打1h40min由于实习用到了kafka,问了很多kafka的八股分布式id怎么实现?问优先队列怎么实现?问延迟队列怎么实现?美团怎实现的?问死信队列?kafka为什么高效?RabbitMQ怎么实现延迟队列?concurrentHashMap?Spring 的AOP原理?(回答JDK/CGlib动态代理)追问动态代理的底层?(反射)追问反射的底层?redis事务?redis持久化?AOF重写?redis过期删除策略?Zset底层原理?事务的隔离级别?每个隔离级别解决什么问题?深度分页问题:sql怎么实现分页查找?(limit)深度分页问题以及怎么解决?sql执行的流程?RateLimiter令牌桶低层原理?MyBatis的缓存了解吗?线程,携程区别?什么时候用线程什么时候用携程?Linux虚拟内存?键入网址到网页显示,期间发生了什么?一台机器作为客户端,但其上有大量的tcp连接time wait是什么原因?代码题:大于目标值的最短子数组场景题给你两个文件,每个文件包含上亿的url(最长64byte),让你找出重复的?问你性格怎么样?4月27 腾讯云 二面主要问实习算法: 长度为n的数组,要求数组和为k的倍数,且数组的最大值最小
点赞 评论 收藏
分享
1.请简述什么是大模型,以及它与传统模型的主要区别是什么?2.你如何评估大模型的性能?有哪些常用的评估指标?3.请描述一下你如何对大模型进行优化,以提高其性能和效率。4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?8.在大模型设计中,如何权衡模型的复杂度和性能?9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?12. reward model如何训练的,训练目标是什么?13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?14.指令跟随能力的评估集有什么,如何评估的?15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?17.在开发大模型时,当你面临推理阶段的资源需求时,你如何确保模型的可解释性和公平性?18.谈谈你对Transformer模型的理解,以及它在自然语言处理中的应用。19.请简述Transformer的基本结构和工作原理?20.为什么Transformer使用位置编码(Positional Encoding)?21.如何优化 Transformer 模型的性能?22.Transformer在自然语言处理中有哪些应用?23.transformer里边norm的位置在哪里,norm如何计算的多头自注意力机制的作用是什么?24.注意力机制为什么除以根号dk, 为什么不是dk请解释什么是注意力机制,并举例说明其应用场景。25.注意力机制是如何工作的?请简述其计算过程。26.多头注意力机制是什么?它相比单头注意力有什么优势?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
牛客网
牛客企业服务