京东算法岗一面面经
DeepFM 的原理是啥?它的输出是怎么处理的?
Qwen-VL 是怎么压缩图片 token 的?
长上下文一般怎么处理?
多模态大模型里,图片和文本的 token 是先处理哪个?处理方式有啥区别?
聊聊 3D 并行和 DeepSpeed?
讲讲 SFT 和 RLHF?原理是啥,有啥区别?
1. 找出一个数组里严格递增的最长子串。
2. 找出字符串里最长的不重复子串,并计算它出现了多少次。
DeepFM 的原理是啥?它的输出是怎么处理的?
Qwen-VL 是怎么压缩图片 token 的?
长上下文一般怎么处理?
多模态大模型里,图片和文本的 token 是先处理哪个?处理方式有啥区别?
聊聊 3D 并行和 DeepSpeed?
讲讲 SFT 和 RLHF?原理是啥,有啥区别?
1. 找出一个数组里严格递增的最长子串。
2. 找出字符串里最长的不重复子串,并计算它出现了多少次。
相关推荐