百度大模型训练一面-日常实习

1.项目拷打
2.手撕代码 leetcode 128
3.八股
介绍下vllm的技术点。
介绍下KV Cache,GQA,MQA,MHA
lora的原理,lora会不会更新原来的权重,如果对embedding层也配置了lora会不会更新。
topK和topP采样方法,采样温度的数值有什么意义
全部评论

相关推荐

评论
2
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务