字节大模型算法工程师
组是负责处理字节内部事宜的工作,可以说是什么都干,监测票据、查找文本特殊信息、总结文件等等。
拷打实习
transformer 前馈神经网络的结构, 为什么会先提升维度后缩小维度
multihead 如果改变head个数会影响参数量吗
大模型是temperature先起作用还是top p
如何解决幻觉,复读机问题
如何处理局部最优点
过拟合
l1,l2区别,用法
力扣1650 二叉树的最近公共祖先
组是负责处理字节内部事宜的工作,可以说是什么都干,监测票据、查找文本特殊信息、总结文件等等。
拷打实习
transformer 前馈神经网络的结构, 为什么会先提升维度后缩小维度
multihead 如果改变head个数会影响参数量吗
大模型是temperature先起作用还是top p
如何解决幻觉,复读机问题
如何处理局部最优点
过拟合
l1,l2区别,用法
力扣1650 二叉树的最近公共祖先
相关推荐
天降大厂offer:想从事前端就放前端的技术栈,然后项目描述,还有项目做了什么内容,使用了什么技术解决了什么问题优化了什么性能。然后头像可以不要,在读也可以不要,还有bg的话就不要放课程,写哪个学校什么本科,还有绩点排名(如果高的话),然后就是技术栈写好一点,接下来就是项目(有实习就写实习,没有就到项目),项目放两个好一点的,自己包装一下,然后有参加什么竞赛放两个就好了,接下来就是靠你自己了,毕竟211还是很难容易找的,不像我们学院本