阿里国际大模型算法-日常实习一面
攒人品中~~~
1.项目介绍
2.拷打实习
3.pagedattention解释 continuebatching解释
用了vllm加速后前后推理一致率怎么样
4.warmup为什么是前100步除了损失变化更快还有什么变化
5.大模型是什么结构 看过源码吗
6.为什么用这两个数据集 和你自己的数据 数据配比怎么样
7.多模任务和文本什么区别
8.拷打项目
9.解释redis和sql区别
10.解释bm25公式劣势如何改进
11.解释bge reranker精排别的精排方式有哪些12.模型是离线还是在线 和主流在线比谁更快
token输出速度是多少
13.解释评估中的ssim
14.手撕mha
1.项目介绍
2.拷打实习
3.pagedattention解释 continuebatching解释
用了vllm加速后前后推理一致率怎么样
4.warmup为什么是前100步除了损失变化更快还有什么变化
5.大模型是什么结构 看过源码吗
6.为什么用这两个数据集 和你自己的数据 数据配比怎么样
7.多模任务和文本什么区别
8.拷打项目
9.解释redis和sql区别
10.解释bm25公式劣势如何改进
11.解释bge reranker精排别的精排方式有哪些12.模型是离线还是在线 和主流在线比谁更快
token输出速度是多少
13.解释评估中的ssim
14.手撕mha
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV

感觉问的似乎还行啊
考虑我司不 欢迎联系
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
03-24 22:45
中国传媒大学 运营 点赞 评论 收藏
分享

查看11道真题和解析