招银网络科技 运维研发 面经

  • 10.14更新,已经挂了
  • 一面,全程30分钟,主要问项目,稍微问了点八股
    • 手撕:1~20的阶乘和
      • 追问:如果要加上算0的阶乘,你怎么算
    • 面试官1
      • 实习拷打
      • 大模型的基本结构
        • 说了Transformer
          • 结构:encoder、decoder
          • embedding、多头注意、norm、前向反馈、输入输出
      • RNN与Transformer的区别是什么?序列长度呢?
      • 梯度消失与梯度爆炸
      • Pytorch与TensorFlow区别
      • 损失函数用过哪些?
        • L1、L2、MSE、二元分类交叉熵
        • 写一下二元分类交叉熵的公式
    • 面试官2
      • RNN与LSTM的关系与区别
      • LSTM
        • 结构,详细介绍一下三个门
        • 输入门的输入是什么
        • 遗忘门的激活函数是什么
      • 对计算机基本原理了解?
        • 说了项目部署在Linux与docker上,应用级别的懂点
      • 对数据结构与算法了解?
        • 说一下你了解的算法,排序举例
          • 说了冒泡、归并、快排、选择排序
          • 追问说个具体的思路:选择排序
        • 面向对象三要素是?
          • 基本特征:封装、继承、多态
  • 二面,全程40分钟,八股问得多,发挥一般,看起来是部门主管
    • 手撕:冒泡排序
    • 对什么排序还有了解
      • 说了快速排序、选择排序
      • 详细说一下快速排序
    • 堆与栈的关系、区别
    • 面向对象的设计模式
      • 工厂
      • 单例
        • 饿汉、懒汉
    • 软件开发周期?
      • 计划阶段分析阶段实现阶段测试阶段运行维护阶段
    • MySQL有了解吗
      • 底层引擎有了解吗
      • CAID
      • 非关系型的数据库有了解吗
    • 深拷贝与浅拷贝
    • 语言方面常用哪些?
      • 说了主要用Python、C++会些
      • 面试官说主要用C++或java,表了一下学习能力的决心
    • 项目拷打
      • 你觉得的核心技术
      • 你觉得哪里能改进
      • 用途是什么,使用场景
      • 现在都是谁在用
      • 项目负责人,做了什么?怎么合作?
      • 有争执吗?
    • 关于专业与现在做的项目不是很贴合
      • 本人专业是通信,但是搞的更多是软开的东西,为什么
    • 说一下对运维的了解
    • 如果现在有成千的电脑数据,CPU或者什么别的数据需要你分析你回怎么办
    • 对运维的接受程度
      • 要会软硬件的较底层知识,是否接受
    • 反问:
      • 运维与开发更偏那种
        • 有传统运维,但基本上都是用新方法
      • 要不要守夜
        • 两三周轮到一次 到晚上8点9点差不多
#招银网络##运维研发##面经#
全部评论
运维怎么全是问ai和开发
6 回复 分享
发布于 2024-11-21 10:21 广东
什么运维研发上来就transformer
点赞 回复 分享
发布于 03-27 12:01 广东

相关推荐

1.请简述什么是大模型,以及它与传统模型的主要区别是什么?2.你如何评估大模型的性能?有哪些常用的评估指标?3.请描述一下你如何对大模型进行优化,以提高其性能和效率。4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?8.在大模型设计中,如何权衡模型的复杂度和性能?9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?10.请简述你了解的大模型的主要结构特点。11.reward bench上的reward model分哪几类?12. reward model如何训练的,训练目标是什么?13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?14.指令跟随能力的评估集有什么,如何评估的?15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?17.在开发大模型时,当你面临推理阶段的资源需求时,你如何确保模型的可解释性和公平性?18.谈谈你对Transformer模型的理解,以及它在自然语言处理中的应用。19.请简述Transformer的基本结构和工作原理?20.为什么Transformer使用位置编码(Positional Encoding)?21.如何优化 Transformer 模型的性能?22.Transformer在自然语言处理中有哪些应用?23.transformer里边norm的位置在哪里,norm如何计算的多头自注意力机制的作用是什么?24.注意力机制为什么除以根号dk, 为什么不是dk请解释什么是注意力机制,并举例说明其应用场景。25.注意力机制是如何工作的?请简述其计算过程。26.多头注意力机制是什么?它相比单头注意力有什么优势?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
评论
7
29
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务