蚂蚁集团AI应用开发一面

蚂蚁国际 - AI风控 暑期实习一面 60min
问八股:
1.介绍一下transformer架构,它解决了rnn和cnn哪些无法解决的问题?
2.怎么理解词与词之间距离的概念?为什么大模型需要知道这个距离?
3.transformer的核心机制是什么?能不能用一个具体的例子串一遍里面所有概念?
4.你提到的QKV能不能具体讲一下?它的核心作用是什么?
5.模型层叠加之后会出现什么问题?我们要引入什么机制去解决这个问题?
6.传统的残差机制会有什么问题?现在业界有没有提出一些新的解决方案?
7.现在业界有很多先进的大模型,有些是7b,有些是325b,这个b的概念是什么?我们在做模型选择的时候怎么选?
8.对于不同的细分领域,能不能讲一下你对现有的模型厂商他们参数量选型的了解?
9.现在给你一个场景,比如说我们做ai coding,你会怎么去选择参数量?
10.对话型模型和推理型模型之间的区别是什么?分别适用于什么样的场景?
11.简要的介绍一下engine、sub engine、skill、mcp这几个概念,他们的用途是什么?在代码开发过程中分别用来解决什么问题?
12.在开发过程中,多轮迭代会话后工程越来越难以维护,你有没有什么好的建议?
13.对于上下文工程的最佳实践,常用到的一些技术或者解决方案都有哪些?
14.目前这个体系还很复杂,有没有现成的东西来辅助我?有没有了解现在开源社区很火的一些解决方案?
问实习:
15.聊一下实习期间你遇到最困难的一件事,这件事你是怎么解决的?得到了一个什么样的效果或结果?
16.为什么你会选择lsp这个方案?你是怎么找到和评估这个方案的?
17.如果说进一步提升的话,你觉得还有什么方向可以改进?让你现在再做一遍的话你是否会选择重新设计?
无手撕
18.反问

3.23面的,3.28收到感谢信,被老东家拷打麻了
#AI求职记录#
全部评论

相关推荐

点赞 评论 收藏
分享
评论
1
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务