boss 一面
实习一深挖
- 优化目标是什么
- 权重是加上去还是替换
- loss权重如何确定
- 模拟评估时,没有真实的用户数据,如何评估效果
- 特征怎么处理(问的比较详细)
- 文本向量,数值向量直接拼接,会不会有向量空间不一致的问题
- 为什么要下采样
- 正负样本差很多时,还适合用auc吗?如何不适合,应该用什么指标
- 专家塔数量是多少?如果遇到塌陷情况怎么做
- 有没有输出看专家塔学习到的特征是什么,会不会学重复
实习二提问
- loss函数是什么(大模型微调)
- 为什么用qwen-0.6b
代码
- 链表的两数相加
实习一深挖
实习二提问
代码
相关推荐