面壁智能大模型一面

手撕:MHA 自我介绍+项目提问约30分钟 涉及八股: Sft的损失函数怎样计算 grpo相对于ppo的改进 grpo的缺点以及改进算法 介绍几种并行训练方式(tp.pp等)哪一种最常用 训练的前向和后向过程中有哪些中间值是fp32,哪些是fp16 场景题: 一个2b的小模型,要想提高其在运算方面的数学能力,怎么设计训练方式?
全部评论
同学,瞅瞅我司,医疗独角兽~ 我的主页最新动态,绿灯直达,免笔试~
1 回复 分享
发布于 昨天 09:11 广东

相关推荐

暂时还没到逼签的地步,基本也都还没开奖,只是想整理一下比较想去的几个意向(略微防定位),听听大佬们的意见(部门情况、业务属性、工作强度、发展等各个方面都可以聊)。本人主打一个听劝!请大佬们畅所欲言1.美团-核心本地商业-基础研发平台-base北京优点:业务比较核,强度适中缺点:公司前景,校招生稳定系数低2.腾讯-PCG-技术公线(略微调整了下,防定位)优点:鹅缺点:PCG整体属于中等偏下(但无奈被捞了就好好面,没想到就拿这个了),业务蛮小众有一定风险(但腾讯似乎这种小众方向还真不少),对部门内部情况没有任何了解,甚至在网上也没见到多少了解的人提供过信息,很怕被边缘3.百度-文心-基座-base北京优点:核,有加大投入的趋势,基座缺点:强度据说较大,晋升难,薪资大概率打不过其他几个,同样对部门内部情况没有任何了解4.中兴-蓝剑-LLM/AI优点:嫡,相对稳定,下限高同时比较养老,基本永久绝缘背差绩效的情况(个人认为这个很重要)缺点:平台,(至少技术)上限低容易脱轨,跳槽难5.拼多多-(部门不清楚)-算法/LLM-base上海优缺点:多多无需多言还有其他一些意向已经不属于优先考虑的梯队了,就不聊了。整体而言个人意愿:发展>工作强度>技术>稳定>时薪(感觉都大差不差)属于比较土味的摆子,硬卷是卷不动的。大佬们走过路过不要错过
投递美团等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务