滴滴 大模型应用 L Lab面经,一二面
部门:滴滴关于agent场景的大模型应用,例如规划行程、帮打车之类的
一面:
项目:聊了两个实习项目,一个是sft大模型的,一个是大模型建模的
八股:无
手撕:最长递增子序列
二面:
项目:无
八股:
开放性问题:一个基座模型在三种数据上微调后,出现了三种错误:a.答案正确但没有符合其他用户要求(用户要求简短输出却输出很长)b.输出一直重复 c.输出错误答案。
这三种情况的原因是什么?有什么解决办法?用思维链的方式分别对这三种问题有效果吗?
手撕:上来就是两个手撕题,被吓到了。磕磕绊绊做出来了[捂脸R]
1.不能调包,纯手写linear regression
2.统计10000以内的质数数量