首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
OfferDeriver
2024-07-10 23:24
武汉理工大学 算法工程师
发布于广东
关注
已关注
取消关注
研0明天开始刷力扣咯,今天Docker坑
今天Docker真的坑啊,31版本不显示docker-desktop-data,在docker desktop里面升级最新版本又升级不了,挂了梯子也还是不行,差评。只能在百度云找资源下了。折腾了一整天破事:docker镜像容器突然都没了,C语言vscode配环境,学术LLM环境也没配好
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
01-10 02:30
北京大学 算法工程师
字节大模型算法实习一面
1.项目介绍2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?3.RAG 和 GraphRAG 在处理多跳推理时的根本?4.RAG 的整体流程5.GraphRAG 系统整体流程6.RoPE 为什么能实现相对位置编码?7.Transformer 中因果注意力和双向注意力的区别8.手撕代码题:最长连续递增子序列(LeetCode 674)
查看7道真题和解析
点赞
评论
收藏
分享
01-10 05:25
西安交通大学 算法工程师
字节大模型算法实习一面
八股 1. Llama的Decoder结构、位置编码有什么改进?2. 三角函数位置编码和ROPE的区别?他们是怎么实现不同的功能?3. 介绍一下RLHF流程,包括哪几步4. llm有哪些评估指标?如何评估模型?5. lora原理细节,为什么可以加速?什么是秩?6. 介绍下Reward model7. dpo训练的损失函数和训练目标8. 不做DPO,只做SFT可以吗?9. Deepseek中SFT冷启动了解吗?手撕10. 给定长度为 n+1 的数组 nums,其中元素取值范围为 [1, n],求唯一的重复数(力扣287)。11. 手写多头注意力MHA。
查看11道真题和解析
点赞
评论
收藏
分享
01-10 23:15
山东大学 算法工程师
小红书大模型算法实习二面
1️⃣实习介绍2️⃣基本就是顺着简历全在问八股1.Transformer 的结构,有哪些可以学习的参数2.多头自注意力结构,矩阵个数3.ffn结构4.encoded decoder 区别5.一个 decoder block 由几个部分组成6.encoder 的输出,作为什么到 decoder7.为什么 decoder 更适合生成8.decided mask 在推理中有用吗9.Transformers 各个架构的改进(attention/ffn/位置编码)分为:10.GQA MHA MQA 区别11.swiGLU 的改进12.rope 在哪里加入3️⃣然后开始项目,其实也问很多八股:1.用的什么开源 dpo 数据2.为什么没用 qwen-33.全参数微调 7B 需要多少显存4.FP16/BF16 区别5.AdamW 显存计算6.介绍 Flash attention7.介绍 gradient checkpoint8.RougeL 计算方法9.代码:找数组第 k 大元素
查看21道真题和解析
点赞
评论
收藏
分享
01-08 05:25
北京大学 算法工程师
阿里多模态大模型算法二面-实习面经
1.项目经历2.模型的 loss 函数前乘以10,会对训练造成什么影响?3.deepseek v3的 rope 实现? deepseek r1的训练过程?4.做过 rag 是吗?介绍 graph rag ?5.bge 和 gte 模型怎么训练的?为什么不能直接用 bert - base 来做余弦相似度召回?6.对比学习的常用 loss 有哪些? InfoNCE 的超参数?温度系数对训练的影响?7. gradient checkpointing 原理? gradient _ accumulation 原理?8.多模态大模型的预训练原理?预训练一般分为几个阶段? ViT 现在一般用什么方法进行预训练?9. 手撕:梯度下降求平方根。
查看9道真题和解析
点赞
评论
收藏
分享
01-09 00:15
中南大学 算法工程师
字节大模型算法校招一面
1、实习介绍2、讲述论文内容和细节。3、对于模型训练过程中,如果出现样本标签数据分布极其不均衡,通常会采取什么方法来解决问题。4、transformer的感受野encoder中是可以看到所有的token的,你认为感受野越大越好还是越小越好。5、位置编码:sin cos,正余弦,bert可学习位置编码,rope相比于正余弦编码的优势。6、欠拟合和过拟合定义,通常如何解决?7、transformer的位置编码的基底是10000,为什么设置100008、手撕:岛屿的数量。
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
2027届暑期实习大科普,为什么从来没人给你讲过这些事情?
7155
2
...
面试官视角聊聊:秋招AI岗高频面试问题
4770
3
...
字节剪映后端一面凉经😭
2742
4
...
腾讯HR与管理线后台 实习 开发一面
2671
5
...
美团测开->腾讯后端,感谢那个不愿放弃的自我
2261
6
...
哈啰后端一面
2230
7
...
实习中找暑期实习的几个问题
1973
8
...
从荆棘到向阳,再到被丢进人才库:一个普通人的大厂梦碎实录
1511
9
...
暑期实习 字节二面
1441
10
...
双非本第一次实习
1307
创作者周榜
更多
正在热议
更多
#
开工第一帖
#
94994次浏览
1532人参与
#
关于提前批我想问
#
278539次浏览
2333人参与
#
应届生,你找到工作了吗
#
115116次浏览
707人参与
#
牛友的志愿填报指南
#
53240次浏览
350人参与
#
秋招感动瞬间
#
116150次浏览
521人参与
#
如果没找到工作,考公是你的退路吗
#
64589次浏览
445人参与
#
业务面应该做哪些准备
#
98002次浏览
1088人参与
#
实习心态崩了
#
105322次浏览
528人参与
#
通信硬件薪资爆料
#
1241196次浏览
7218人参与
#
24秋招避雷总结
#
947095次浏览
7039人参与
#
字节出了豆包coding模型
#
10679次浏览
74人参与
#
我的求职精神状态
#
435746次浏览
3102人参与
#
xx岗简历求拷打
#
31826次浏览
259人参与
#
听劝,这个简历怎么改
#
386654次浏览
1841人参与
#
你找工作的时候用AI吗?
#
181274次浏览
926人参与
#
搜狐工作体验
#
4372次浏览
35人参与
#
实习最晚的一次下班是几点
#
27057次浏览
135人参与
#
双非本科的出路是什么?
#
213222次浏览
1586人参与
#
今年形式下双非本找得到工作吗
#
290116次浏览
1658人参与
#
掌握什么AI技能,会为你的求职大大加分
#
20547次浏览
681人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务