阿里国际大模型算法-日常实习一面

攒人品中~~~
1.项目介绍
2.拷打实习
3.pagedattention解释 continuebatching解释
用了vllm加速后前后推理一致率怎么样
4.warmup为什么是前100步除了损失变化更快还有什么变化
5.大模型是什么结构 看过源码吗
6.为什么用这两个数据集 和你自己的数据 数据配比怎么样
7.多模任务和文本什么区别
8.拷打项目
9.解释redis和sql区别
10.解释bm25公式劣势如何改进
11.解释bge reranker精排别的精排方式有哪些12.模型是离线还是在线 和主流在线比谁更快
token输出速度是多少
13.解释评估中的ssim
14.手撕mha
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 今天 07:37 广东
感觉问的似乎还行啊
点赞 回复 分享
发布于 昨天 22:55 北京
考虑我司不 欢迎联系
点赞 回复 分享
发布于 昨天 16:01 上海

相关推荐

KKorz:是这样的,还会定期默写抽查
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务