27届实习记录:在MiniMax的3个月
刚好晚上吃饭的时候闲来无事,随笔记录一下来MiniMax实习3个月的真实感受,给正在看机会的兄弟们一些参考:
关于技术氛围:
怎么说呢,这边确实能接触到比较核心的东西,而且有着大厂没有的“高速”,比如我第二周就开始跟着调优M2.5的代码了。
记得当时在做模型“自我修正”能力的优化,我提了个想法:能不能让模型遇到编译报错时,模拟编译器思路走一圈?mentor听了没含糊其辞的让我只关注他安排的工作,而是直接说“你做个Demo试试”。然后我就去做了,最后效果还行就被采纳了,说实话很有成就感。
之前在别的地方面试时,很多面试官画的饼比这大多了,但来了之后发现根本碰不到核心业务。这边至少让你真动手,不只是听概念。
关于Mentorship:
我的mentor人挺实在的,但是指导方式.....emmm怎么形容呢,不是那种手把手教的类型,应该算是引导型?
分享一下我们的日常给大家感受一下,有次我为了赶一个Agent工具调用的demo,写了一堆if-else,自己都知道写得烂。Code Review时他没直接说我代码写的烂(虽然是事实),而是跟我聊:“咱现在写的每行代码,以后都可能变成M2.6甚至M3.0的训练语料。”
然后他花了一下午重构了代码,引入工厂模式,还顺便给我讲了讲大模型底层MoE路由的原理。
刚开始我觉得重构挺浪费时间的,但后来想想确实帮我理解了“为什么这么写”比“怎么写”更重要,算是被带着上了一课。
关于工作方式:
这边节奏不算轻松,但卷的方向比较明确。API额度确实不设限,但我发现也没人真去“刷”ArXiv……主要还是先把分配的活干完。干完了可以自由安排时间,去看论文、琢磨优化都可以。
同事之间氛围还行,有问题直接问,不用绕来绕去。扁平化这个点虽然被说烂了,但确实不用天天写周报(感动)。
总结:
在MiniMax这里,整体感觉就是:你做的事能被看见,想法能被试,愿意学也能学到东西。对想踏实做点事的同学来说,是个不错的地方。今天就分享到这里了,继续肝大模型去了。
#MiniMax求职进展汇总#
关于技术氛围:
怎么说呢,这边确实能接触到比较核心的东西,而且有着大厂没有的“高速”,比如我第二周就开始跟着调优M2.5的代码了。
记得当时在做模型“自我修正”能力的优化,我提了个想法:能不能让模型遇到编译报错时,模拟编译器思路走一圈?mentor听了没含糊其辞的让我只关注他安排的工作,而是直接说“你做个Demo试试”。然后我就去做了,最后效果还行就被采纳了,说实话很有成就感。
之前在别的地方面试时,很多面试官画的饼比这大多了,但来了之后发现根本碰不到核心业务。这边至少让你真动手,不只是听概念。
关于Mentorship:
我的mentor人挺实在的,但是指导方式.....emmm怎么形容呢,不是那种手把手教的类型,应该算是引导型?
分享一下我们的日常给大家感受一下,有次我为了赶一个Agent工具调用的demo,写了一堆if-else,自己都知道写得烂。Code Review时他没直接说我代码写的烂(虽然是事实),而是跟我聊:“咱现在写的每行代码,以后都可能变成M2.6甚至M3.0的训练语料。”
然后他花了一下午重构了代码,引入工厂模式,还顺便给我讲了讲大模型底层MoE路由的原理。
刚开始我觉得重构挺浪费时间的,但后来想想确实帮我理解了“为什么这么写”比“怎么写”更重要,算是被带着上了一课。
关于工作方式:
这边节奏不算轻松,但卷的方向比较明确。API额度确实不设限,但我发现也没人真去“刷”ArXiv……主要还是先把分配的活干完。干完了可以自由安排时间,去看论文、琢磨优化都可以。
同事之间氛围还行,有问题直接问,不用绕来绕去。扁平化这个点虽然被说烂了,但确实不用天天写周报(感动)。
总结:
在MiniMax这里,整体感觉就是:你做的事能被看见,想法能被试,愿意学也能学到东西。对想踏实做点事的同学来说,是个不错的地方。今天就分享到这里了,继续肝大模型去了。
#MiniMax求职进展汇总#
全部评论
MiniMax大热门啊,我也想去
相关推荐
点赞 评论 收藏
分享
查看6道真题和解析 点赞 评论 收藏
分享