首页 > 试题广场 >

在Transformer的多头注意力机制中,如果模型维度为5

[单选题]
在Transformer的多头注意力机制中,如果模型维度为512,使用8个注意力头,每个头的Q、K、V向量维度为多少?
  • 512
  • 256
  • 64
  • 32

这道题你会答吗?花几分钟告诉大家答案吧!