字节跳动算法一面面经
自我介绍2min
拷打项目
损失函数设计
LoRA吟唱
手撕MHA
看你除以了根号k 有什么作用
梯度消失和梯度爆炸 如何缓解
QKV代表什么 说说理解
如果QK变成同一个矩阵你觉得有什么影响
除了LoRA还有什么微调的方法
实习并未拷打
做的主要是Agent相关的
简单问了下RAG和CodeAct就过了
手撕
面试官说出个简单一点的,n个长为m的升序数组,找TOPK
自我介绍2min
拷打项目
损失函数设计
LoRA吟唱
手撕MHA
看你除以了根号k 有什么作用
梯度消失和梯度爆炸 如何缓解
QKV代表什么 说说理解
如果QK变成同一个矩阵你觉得有什么影响
除了LoRA还有什么微调的方法
实习并未拷打
做的主要是Agent相关的
简单问了下RAG和CodeAct就过了
手撕
面试官说出个简单一点的,n个长为m的升序数组,找TOPK
相关推荐
书海为家:#人脑vsAI#
尽管深度学习的最初灵感来源于人类的大脑,但二者的运作方式截然不同:深度学习所需要的数据量远比人脑所需要的多得多。可是一旦经过大数据训练,它在相同领域的表现将远远超过人类(尤其是在数字的量化学习,例如挑选某人最可能购买的产品,或从100万张脸中挑选最匹配的一张)——相对来说,人类在同一时间内只能把注意力放在少数几件事情上面,而深度学习算法却可以同时处理海量信息,并且发现在大量数据背后的模糊特征之间的关联,这些模糊特征不仅复杂而且微妙,人类往往无法理解,甚至可能不会注意到。
虽然深度学习拥有人类所缺乏的并行处理海量数据的“绝技”,但不具备人类在面对决策时独一无二的汲取过去的经验、使用抽象概念和常识的能力。
与人类相比,深度学习想要充分发挥作用,离不开海量的相关数据、单一领域的应用场景以及明确的目标函数,这三项缺一不可,如果缺少其中任何一项,深度学习将无用武之地。