算法打工人 level
获赞
16
粉丝
17
关注
0
看过 TA
134
中山大学
2026
算法工程师
IP属地:山东
咨询辅导:请联系牛客账号 算法打工人阿旺
私信
关注
1️⃣优化出发点推荐系统的发展始终围绕一个核心问题:如何精准理解用户偏好并匹配最相关的内容。✅冷启动困境:新加入系统的物品由于缺乏历史交互数据,其ID嵌入往往难以准确学习,导致推荐效果差。这与NLP中的未登录词(OOV)问题类似,严重限制了系统对新物品的推荐能力。✅泛化性不足:ID token难以捕捉相似物品间的共享特征,每个物品都被视为完全独立的实体,忽视了它们之间可能存在的语义关联。2️⃣模型架构:双token统一与距离度量创新的完美融合统一表征学习框架是一个精心设计的系统,主要由三个创新组件构成:统一的语义与ID tokenization策略、融合余弦相似度与欧氏距离的度量方法,以及端到端的联合优化机制。✅统一语义与ID tokenization:框架的核心思想是保留ID token的必要维度来表征物品独特属性,同时用语义token替代冗余维度来捕捉共享特征。✅统一距离度量:解耦与区分的层次化策略,论文的另一个关键贡献是对不同相似度度量在推荐系统中作用的深入分析。端到端联合优化:三重损失协同训练    为确保各组件协调工作,框架采用端到端训练方式,同时优化三个关键目标:推荐损失;RQ-VAE量化损失;文本重建损失。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享
查看14道真题和解析
0 点赞 评论 收藏
分享
1️⃣一面 1.自我介绍2.介绍一下项目,遇到的难点和解决的问题3.介绍Transformer,编码器和解码器的注意力有什么区别4.了解CLIP吗 ,介绍一下其他的对比学习方法5.说一下R1的训练过程6.BLIP 的三个损失函数分别是什么,数据是怎样清洗的7.BLIP2相对于 BLIP 有哪些改进,BLIP3又有哪些改进8.视觉编码器和 LLM 连接时,使用BLIP2中 Q - Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好,说说各自的优缺点9.代码:买卖股票最佳时机2️⃣二面1.自我介绍和过项目2.Qwen- VL 的三个训练流程分别是什么,有什么作用介绍一下 CLIP3.后来有哪些比较经典的基于 Transformer 的语言模型, Qwen 相比于原始 Transformer 有哪些结构上的改动4.了解 RLHF 吗, DPO 和 PPO 有什么区别, Loss 是什么样的,各自的优缺点是什么5.了解哪些多模态大模型,简要介绍几个6.了解 LoRA 吗, LoRA 微调的原理是什么7.对PPO DPO GRPO计算逻辑的理解8.代码:实现多头自注意力3️⃣三面1.自我介绍和实习经历介绍2.GNN与LLM结合理解3.场景题:涉及偏好对话模型4.反问:岗位职责和未来规划📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看21道真题和解析
0 点赞 评论 收藏
分享
1️⃣数据方面数据可以说是整个项目中最重要的一个环节,是决定项目成败的最关键因素,目前主流的观点认为,数据的质量和多样性比数据的量级更加重要,大量的噪声和单一的数据构成都会使得模型训练产生偏误。第一,先抛弃掉互联网上随处可见的训练数据, “自制”数据集的最大优势,不在于数据量的庞大,而在于它们独特且贴近实际业务场景。这不仅能体现你的技术动手能力,更能展示你对业务的敏感度和创新意识。哪怕你只爬取了几百条数据,依然会有很不错的效果。在实际工作中(对于Post Training方向),数据处理也是接触的最频繁的工作。面对纷繁复杂、体量巨大的原始数据,如何精准筛选出高价值的部分(如果数量不足,如何使用合成数据的方法补充体量),并高效通过处理流程,正是一个微调项目中最精华的部分,微调技术的选用相比之下都称得上是细枝末节。2️⃣评测方面面试官想要听到的,是你是否有科学、系统的评测方法,能用客观的数据和标准来说明你的模型效果。比如:你有没有设计一套评测集,来检测模型对于不同语境的还原能力?你有没有和原始未微调的模型做对比,看微调前后在同一组输入下的输出差异?你有没有用自动化指标来衡量模型生成内容和原始语料的相似度?这是真正重要的技术检验方法,也是评测方法必须放在微调之前的原因。毕竟,如果原版模型就能在评测集上做到90%以上的相似度,再怎么微调,在人的感官上也是相差无几的。你需要有一个大模型目前掌握得不好的测评集,才有在指标上提高的空间。当然,对于一个玩具项目来说,能做到有评测集、有一个以上的评价指标、有对比试验就已经很不错了。3️⃣调参方面调参很有用,但是数据更加重要。调参解决的是“怎么把现有数据学得更好”,而数据优化解决的却是“模型到底要学什么”。别把所有的希望都寄托在参数上。与其在显卡前焦虑地等待下一组实验结果,不如多花一点时间,和你的数据、你的业务、你的评测集聊聊天。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务