蚂蚁集团应用开发一面

1.介绍一下transformer架构,它解决了rnn和cnn哪些无法解决的问题?
2.怎么理解词与词之间距离的概念?为什么大模型需要知道这个距离?
3.transformer的核心机制是什么?能不能用一个具体的例子串一遍里面所有概念?
4.你提到的QKV能不能具体讲一下?它的核心作用是什么?
5.模型层叠加之后会出现什么问题?我们要引入什么机制去解决这个问题?
6.传统的残差机制会有什么问题?现在业界有没有提出一些新的解决方案?
7.现在业界有很多先进的大模型,有些是7b,有些是325b,这个b的概念是什么?我们在做模型选择的时候怎么选?
8.对于不同的细分领域,能不能讲一下你对现有的模型厂商他们参数量选型的了解?
9.现在给你一个场景,比如说我们做ai coding,你会怎么去选择参数量?
10.对话型模型和推理型模型之间的区别是什么?分别适用于什么样的场景?
11.简要的介绍一下engine、sub engine、skill、mcp这几个概念,他们的用途是什么?在代码开发过程中分别用来解决什么问题?
12.在开发过程中,多轮迭代会话后工程越来越难以维护,你有没有什么好的建议?
13.对于上下文工程的最佳实践,常用到的一些技术或者解决方案都有哪些?
14.目前这个体系还很复杂,有没有现成的东西来辅助我?有没有了解现在开源社区很火的一些解决方案?
15.聊一下实习期间你遇到最困难的一件事,这件事你是怎么解决的?得到了一个什么样的效果或结果?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务