快star大模型应用面经
第一次分享,攒人品!
一面
🕒 岗位/面试时间
快star大模型应用/8月9日早上
👥 面试题目
1.自我介绍
2.题目 leetcode300 最长递增子序列 15min 没让讲思路
3.研究进展,投什么会议
4.实习经历
5.实习项目中数据是怎么做的
追问,数据收集过程中是否有人工处理
蒸馏效果不好的原因是什么,用了什么额外的方式
有没有做量化和加速
6.偏好数据集是什么,偏好怎么定义的
偏好是怎么增强的
7.什么是打判,怎么打判的
使用的什么模型
8.如何解决模型幻觉(分方法,数据,prompt,微调,RAG等等)
9.长token输入效果衰减如何解决,效果如何(长度外推问题,建议直接看苏神的blog)
10.moe和dense模型的区别,各自的优缺点(随便答了一下moe效率高,每次激活一部分参数,但是同等参数量效果应该没有dense好)
反问:组里主要做对内的大模型应用,包括code辅助,个人RAG之类的
🤔 面试感受
面试官人很好,提问欲望强烈,实习经历问的很细,会对着简历上的东西一条一条问,本来还要问我的研究但是没时间了,最后问了三个简单的八股
💢 背景
双C9,一段实习,无论文(或者说正在写)
希望能对大家有帮助!
#面经#
等一下结果
-----------
更新,直接寄!果然人才计划不会要我这种没论文的小菜鸡吗


一面
🕒 岗位/面试时间
快star大模型应用/8月9日早上
👥 面试题目
1.自我介绍
2.题目 leetcode300 最长递增子序列 15min 没让讲思路
3.研究进展,投什么会议
4.实习经历
5.实习项目中数据是怎么做的
追问,数据收集过程中是否有人工处理
蒸馏效果不好的原因是什么,用了什么额外的方式
有没有做量化和加速
6.偏好数据集是什么,偏好怎么定义的
偏好是怎么增强的
7.什么是打判,怎么打判的
使用的什么模型
8.如何解决模型幻觉(分方法,数据,prompt,微调,RAG等等)
9.长token输入效果衰减如何解决,效果如何(长度外推问题,建议直接看苏神的blog)
10.moe和dense模型的区别,各自的优缺点(随便答了一下moe效率高,每次激活一部分参数,但是同等参数量效果应该没有dense好)
反问:组里主要做对内的大模型应用,包括code辅助,个人RAG之类的
🤔 面试感受
面试官人很好,提问欲望强烈,实习经历问的很细,会对着简历上的东西一条一条问,本来还要问我的研究但是没时间了,最后问了三个简单的八股
💢 背景
双C9,一段实习,无论文(或者说正在写)
希望能对大家有帮助!
#面经#
等一下结果
-----------
更新,直接寄!果然人才计划不会要我这种没论文的小菜鸡吗
全部评论
老哥你帖子太有意思了,梗笑的我想死
同一个岗位 本来觉得还行,然后挂了
图挺不错的
确实,我也是这个直接挂
我理解这个岗应该是偏dev,rag agent哪些?
佬总结下llm学习路线


快手面试体验还是可以的
同学,考虑字节商业化LLM算法嘛~
太强了
相关推荐

点赞 评论 收藏
分享
07-01 00:30
西北工业大学 Java 梗小姐:佬,你投的不会是这个吧。
wxg-微信支付-模型组
主要工作方向:
1.利用支付数据、社交数据等制定安全策略进行数据挖掘、特征工程
2.前沿模型研究:利用LLM代替xgboost等传统风控模型
本次实习生,可能的工作:使用司内大模型平台进行agent构建,集成到企业微信机器人里,作为内部工具以消息告警等形式提醒产品同学,其实还是偏开发。
掌握python和java应该够用了。
需要掌握的基本知识
简单的开发技能
agent基本原理(重点:function call,可能会被问了解mcp吗)
LLM基本知识(训练、微调和部署推理,偏工程化),最好再掌握一些RAG知识

点赞 评论 收藏
分享