深言科技nlp算法日常实习二面分享

有面试过同岗的朋友欢迎评论区交流
1.项目细节
2.全量微调和sft rl
3.Dpo rlhf联系区别 ,dpo介绍,ppo和dpo的相似之处
4.prefill和decode的复杂度,kv cache
手撕
1.lc9 最长无重复子串
2.lc1143 最长公共子序列
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务