米哈游 大模型算法 实习二面 55min

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.你如何评估大模型的性能?有哪些常用的评估指标?
3.请描述一下你如何对大模型进行优化,以提高其性能和效率。
4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。
5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?
6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?
7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?
8.在大模型设计中,如何权衡模型的复杂度和性能?
9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?
10.请简述你了解的大模型的主要结构特点。
11.reward bench上的reward model分哪几类?
reward model如何训练的,训练目标是什么?
13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?
全部评论

相关推荐

04-10 13:43
门头沟学院 Java
场景问题 1.JSON 处理场景:如何统计一个复杂 JSON 字符串叶子节点中包含类似 "tencent" 某个字段的个数(使用一些算法的思路)?2.内存受限场景:如果 JSON 字符串极大(单个文件巨大),且内存有严格限制,你会如何优化算法?3.通用组件扩展:如果不限制算法,你会选择哪些中间件或开源方案来实现上述 JSON 检索功能?4.任务调度优化:有一批耗时不等的大量任务正在串行处理,效率很低,作为 SRE 你会如何优化?5.网络协议深度:在浏览器输入 HTTPS 的 URL 后,整个网络请求过程中会产生哪些具体的网络协议交互?实习问题6.CMDB 规模:你参与开发的 CMDB 模块,具体纳管了多少资源和服务(服务器数量级)?7.动态日志治理:这个功能具体是如何实现的?解决了哪些定位成本高的问题?8.量化收益:该优化方案上线后,具体的性能提升数据或排查效率提升比例是多少项目问题9.Agent 架构:你开发的“企业级”AI Agent 平台,其底层架构、执行链路(API/MCP/Model)是如何设计的?10AI 开发思考:Agent 开发与传统业务开发在思维模式上有哪些显著不同?11.多智能体通信:对于多 Agent 之间的沟通协作,你了解哪些先进的协议或学习心得?12.如果你是王者荣耀的 SRE,在面对“全球玩家统一支持”的体验优化需求时,从技术角度看会遇到哪些问题和挑战?
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务