98投递一面是否接受上海base科研论文经历,每一篇论文都深究了一下多头自注意力,和MQA还有GQA区别并行策略(deepzero)(没准备,不会)PPO, DPO,GRPO区别dpo的输入形式和SFT输入形式区别做SFT或者DPO,怎么调整最终效果的,gradient step的含义是什么做算法研究,是不是看论文比较多,工程上的工作会少一点(应该是觉得我代码写的少)论文深究,然后给了个场景题给大量的用户数据(表格数据),提出一种算法改进大模型去评估用户账号的健康程度(0-100),问了挺久也特别细如果有过亿的用户数据,大模型推理太慢了,怎么想办法加快。无代码题反问具体干什么工作(社区治理算法...