字节跳动 大模型算法一面 攒人品中

感觉面完人都通透了,还是太菜了,下去沉淀一下
1- 拷打项目
2- SFT 和 GRPO 在优化目标的区别
3- GRPO 相关八股:
4- Advantages 怎么算的;一组的大小这个超参数,如何影响模型训练
5- 为什么全好或者全坏,那这一步就对模型训练不起作用
6- GRPO 相比 PPO 的改进,好处是?
7- PPO 的 Advantages 具体是怎么计算的
8- code:买卖股票的最佳时机(I 和 II)
全部评论
是实习还是春招呢
点赞 回复 分享
发布于 04-21 22:25 广东

相关推荐

04-22 09:32
已编辑
南京林业大学 后端工程师
发面经攒人品中午没睡着午觉。大脑一片混乱,很多没答上来。结果竟然过了,面完一小时收到二面通知。1. 你的项目有没有真实部署?2. agent项目大模型用的什么?3. 为什么用qwen3.5,其实还有很多比如豆包,当时怎么考虑的?(????)4. react和plan-excuite-replan有什么区别5. 你还知道其他什么模式?6. 有没有听说过multi-agent?(没有)7. 提示词调优你了解吗?讲一讲有哪些策略?(不会)8. 讲一下实习内容9. 更数据的时候,缓存刷新失败了怎么办?10. 设计一套方案解决这个问题11. concurrentHashmap和hashtable有什么区别?12. 讲一下concurrentHashmap的put操作?13. JDK1.7前的concurrentHashmap怎么加锁?14. get加锁吗?15. get有没有可能读到脏数据?16. put成功后,get一定能读到吗?为什么?17. volatile关键字有什么用?18. 怎么理解指令重排?(多线程下的重排是什么忘了)19. 讲一下JDK1.7前的concurrentHashmap底层数据结构20. 插入的时候是头插入还是尾插入?(不知道)21. 讲一下线程池的工作流程22. 自定义一个class,如果重写了equal但是没有重写hashcode,会发生什么?23. 讲一下synchronized锁膨胀过程24. 讲一下java异常的继承结构(忘了)25. 讲一下常见的垃圾回收算法26. 新生代有哪些区域?27. 什么时候young GC,什么时候full GC?(忘了)28. 讲一下java类加载机制(忘了那几个类加载器叫什么了)29. 动态代理方式有几种,有什么区别,使用场景上有什么区别?(忘了那两种分别叫什么了)30. rabbitMq事务消息你知道吗?31. git fetch和git pull有什么吗区别?(不会)32. 怎么切换分支?33. git checkout和git checkout -b有什么区别?34. XSS攻击是什么?35. CSRF攻击是什么?36. 怎么预防CSRF攻击37. 怎么预防xss攻击手撕:hot100原题 31. 下一个排列- 一开始思路想错了,讲思路的时候面试官指出错误后才给出了正确思路反问1. 业务是什么?抖音内部资金安全相关2. 技术栈是什么?golang那一套3. 业务是传统开发还是现在比较流行的agent?现在的工作中有很多结合
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务