大模型算法八股整理(模型架构)

1.介绍Transformer架构
2.多模态大模型架构
3.多模态+GRPO有没有结合的想法和思路
4.MoE架构
5.Token向量化具体怎么计算
6.对于VLM模型的架构是否熟悉
7.视觉编码器是否了解
8.多模态模型如何将文本和图像映射到同一向量空间
9.对VLA、具身智能的了解
10.对clip的理解
11.如何衡量图像embedding和文本embedding之间的相似度
12.Transformer的encoder和decoder区别
13.介绍self attention和cross attention
14.大模型的编码方式有哪些
15.介绍encoding和decoding
16.介绍旋转位置编码
17.大模型的词表是怎么生成和使用的
18.针对不同模型,如何调整提示词以适应其特点
19.Prompt一般是怎么设计的,怎么迭代优化的
20.人工标注vs模型标注,如果使用模型来打标,可能会遇到什么样的问题
21.意图识别中,模糊意图、多意图、意图分类怎么做
22.讲讲glm模型的技术特点,架构等
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务