阿里云大模型算法二面(日常实习
发一下问题给大家参考,攒人品中
1、都知道哪些vllm的优化技术?
2、在现有模型的基础上,由于算力问题,如何利用大模型来蒸馏一个3B的模型?
3、logistic回归的模型原理和loss。
4、给定一个时间序列,如何通过机器学习的方法进行建模筛选出来重要的特征,然后基于规则方法进行建模
5、DeepSeek-MTP是用在训练阶段还是推理阶段的,具体过程是怎样的?
6、在现有大模型的基础上,如何通过agent的相关方法,训练一个coder模型,撰写金融领域相关模型的代码
1、都知道哪些vllm的优化技术?
2、在现有模型的基础上,由于算力问题,如何利用大模型来蒸馏一个3B的模型?
3、logistic回归的模型原理和loss。
4、给定一个时间序列,如何通过机器学习的方法进行建模筛选出来重要的特征,然后基于规则方法进行建模
5、DeepSeek-MTP是用在训练阶段还是推理阶段的,具体过程是怎样的?
6、在现有大模型的基础上,如何通过agent的相关方法,训练一个coder模型,撰写金融领域相关模型的代码
全部评论
感谢楼主的经验分享!
相关推荐
查看7道真题和解析 点赞 评论 收藏
分享