首页 > 试题广场 >

若模型中attention部分head数h=8,GQA分组数

[单选题]
若模型中attention部分head数h=8,GQA分组数g=2,则K/V矩阵的共享情况是
  • 仅Q矩阵分组
  • 每2个头共享K/V,共4组
  • 每组4个头共享K/V
  • 所有头共享同一组K/V

这道题你会答吗?花几分钟告诉大家答案吧!