快手大模型二面

1.自我介绍 2.讲一下你的自动化评估体系是怎么设计的吧 3. markdown转html做报告验证,那你这个合法性是怎么判断合法的?是直接看渲染结果吗?那怎么做自动验证的? 4.你说截图验证,那你这个截图是怎么生成的?怎么知道截图渲染的是正确的 5. Agent 推荐比赛的提示词优化流程讲一下,是怎么构造出更优提示词的 6.你这个提示词优化迭代里面,比如说你怎么判断当前生成提示词就是“最优 7. 刚刚说“反思机制”有个模块,那我想问问这个反思机制是怎么做的?是类似 Chain of Thought 吗?有没有自动修正能力? 8.帮我实现一下Transformer 里面的多头注意力你能现场实现一个类吗?只写初始化和 forward 的部分就行 9.我看你代码里面有个 transpose(1, 2),为啥要 transpose?直接 reshape 不行吗?会有什么问题吗? 18.那你知道这个attention score 为什么要除以 sqrt(d) 吗?如果不除会发生什么 19.Transformer 的参数主要在哪个模块里?比如你写的多头注意力,里面大概有多少参数你能算一下吗 20.Transformer中的LayerNorm和Residual Connection 是什么顺序?为什么要这样设计,如果反过来会有什么后果 21.讲讲 FFN在Transformer 中的作用,为什么一定要有非线性激活 22.你了解 RoPE 吗?它是怎么解决原始 Positional Encoding 难以泛化的问题的 23.为什么大模型都选用GELU而不是 ReLU 或其他激活函数?有没有试验过替换的影响 24.SFT你用的是哪种形式,loss是哪种形式? 25.DPO这块你讲一下它的loss函数是怎么构造的,怎么拿到正负样本对的?比如两个回答你怎么知道哪个更好? 26.你用Claude或人来做偏好打分,那这个偏好数据如果本身存在多样性怎么办?比如两个答案都看起来不错但是风格不一样,怎么办 27.手撕:黄金的价格序列:[7,1,5,3,6,4,2] Q1:一次买卖的最佳收益,比如例子中1买入,6卖出,最佳收益是5 28.我看你是用BFS找最短跳跃路径,如果我现在想知道所有最短路径怎么办 29.现在是一次买卖最大收益是吧,那如果允许你最多两次买卖,怎么来改这个代码呢
全部评论

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务