我也是上周五二面 和补笔试了 然后也是在面试中 到现在也没消息
点赞 8

相关推荐

AI大模型算法,一环扣一环的拷打Transformer 基础详细介绍 Transformer 架构(Encoder-Decoder 结构、位置编码、FFN 等)Decoder 的因果注意力中,Q、K、V 分别来自哪里?→ Q 来自当前 Decoder 输入(已生成的 token 序列),K 和 V 也来自同一序列(需 mask 未来信息)Attention 为什么要 scaled?不做会怎样?为什么是√dₖ?→ 点积随 dₖ增大会让 softmax 进入饱和区,导致梯度消失;除以√dₖ可使方差稳定在 1(数学推导参考 Vaswani 论文)Transformer 如何加速推理?KV Cache 是什么?训练 vs 推理的并行性差异?→ 训练时所有 token 并行计算;推理时自回归,KV Cache 可缓存历史 K/V,避免重复计算,大幅提速多模态论文深挖(以 Video-LLaMA 为例)讲解 Video-LLaMA 的整体结构→ 视频编码器(如 ViT + Temporal Aggregator)→ 投影层(对齐文本空间)→ LLaMA 语言模型论文中 CoT(Chain-of-Thought)的具体设计?→ 在 prompt 中加入推理步骤示例(如 “视频中先看到人挥手,然后狗跑过来…”),引导模型分步作答微调 & 分布式训练微调用了 LoRA,介绍其原理→ 将权重更新 ΔW 分解为低秩矩阵 A×B,冻结原模型,只训练 A、B,大幅减少可训练参数LoRA 初始化怎么做?秩(rank)设为多少?为什么选这个值?→ A ~ N (0, σ²),B 初始化为 0;常用 rank=8 或 16,在效果和参数量间取得平衡(实验验证)知道 DeepSpeed 和 Megatron 吗?分别说说→ DeepSpeed(微软):主打 ZeRO 显存优化;Megatron-LM(NVIDIA):张量并行 + 流水线并行论文用 DeepSpeed,三个 Stage(ZeRO-1/2/3)分别是什么?→ Stage1:优化器状态分片;Stage2:+ 梯度分片;Stage3:+ 模型参数分片(通信换显存)二面下一篇再写吧,力竭了
查看10道真题和解析
点赞 评论 收藏
分享
03-12 14:08
已编辑
清华大学 算法工程师
💻面试岗位:高级移动开发(安卓)❓面试问题:基本题目1、Handler / Looper / MessageQueue 机制题目请你从源码和运行机制角度讲一下:Android 主线程为什么可以一直处理消息而不会退出?Looper.prepare()、Looper.loop()、MessageQueue、Handler 分别起什么作用?Handler.post(Runnable) 和 sendMessage(Message) 本质区别是什么?为什么在子线程直接创建 Handler 有时会报错?Message 为什么要做对象复用?2. Activity / Fragment 生命周期与状态恢复题目假设一个页面发生以下几种情况:横竖屏切换应用切后台被系统回收Fragment 被放入 back stack 再返回页面使用了 ViewPager2 / Navigation请你说明:onSaveInstanceState() 什么时候调用?哪些数据适合放 Bundle,哪些不适合?ViewModel 能解决什么,不能解决什么?Fragment 为什么容易出现生命周期错乱、重复请求、重复订阅?3. Binder 机制与进程间通信题目请你讲一下 Android Binder 机制:Binder 和 Socket / 管道 / 共享内存相比有什么特点?一次 Binder 调用大致流程是什么?为什么 Android 选择 Binder 作为主要 IPC 机制?AIDL 的本质是什么?为什么主线程做 Binder 调用也可能卡顿甚至 ANR?4、RecyclerView 机制与列表性能题目一个复杂信息流列表包含多种 item 类型、图片、视频、曝光埋点和局部刷新,请你讲一下:RecyclerView 的复用机制核心是什么?notifyDataSetChanged()、notifyItemChanged()、DiffUtil 有什么区别?为什么会出现“列表闪动”“错位”“点击错乱”“曝光不准”?复杂列表如何做性能优化?ConcatAdapter、Paging、异步 Diff 的优缺点是什么?场景题目:你负责公司 Android 客户端首页改版。首页是一个高频入口,承载了:信息流列表顶部搜索框Banner多个业务模块卡片实时活动入口未读消息角标A/B 实验动态配置弱网下的缓存回退最近线上出现一个复杂问题:用户冷启动进入首页时,偶发以下现象:首页首屏渲染慢,部分机型首帧超过 1200msBanner 和信息流偶发顺序错乱未读角标有时显示旧数据,切前后台后恢复少量用户出现点击卡片跳错页面埋点显示首页曝光正常,但业务方反馈实际有模块没展示出来这个问题在 debug 环境很难复现,线上高并发活动期间明显增多假设你是这个首页架构的 owner,你会如何分析和推进这个问题?然后手撕:leecode LRU 缓存机制🙌面试感想:
查看21道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务