牛客题解官

02-06 10:32 清华大学 Java 发布于北京

关注

题解|实现自注意力机制

实现自注意力机制

https://www.nowcoder.com/practice/052a6c1df2fa4668a83a6edd7af02874?tpId=377&tags=&title=&difficulty=0&judgeStatus=0&rp=0&sourceUrl=%2Fexam%2Foj

自注意力机制（Self-Attention Mechanism）是一种能够捕获序列内部元素之间关系的机制，它通过计算序列中每个元素与其他所有元素的相关性来实现信息的有效整合。其基本思想是将输入序列映射为查询(Query)、键(Key)和值(Value)三个矩阵，然后通过计算查询和键的相似度得到注意力权重，最后将这些权重与值相乘得到输出。自注意力的计算步骤如下：

计算查询、键和值 $Q = W_Q \cdot X, \quad K = W_K \cdot X, \quad V = W_V \cdot X$ 其中， $X$ 是输入序列， $W_Q$ 、 $W_K$ 和 $W_V$ 是可学习的权重矩阵。
计算注意力分数 $score = \frac{Q \cdot K^T}{\sqrt{d_k}}$
计算注意力权重 $attention = \text{softmax}(score)$ 其中， $\text{softmax}$ 是softmax函数，表达式为 $\text{softmax}(x) = \frac{e^x}{\sum_{i=1}^{n} e^{x_i}}$ 。
计算输出 $output = attention \cdot V$

标准代码如下

def compute_qkv(X, W_q, W_k, W_v):
    Q = np.dot(X, W_q)
    K = np.dot(X, W_k)
    V = np.dot(X, W_v)
    return Q, K, V

def self_attention(Q, K, V):
    d_k = Q.shape[1]
    scores = np.matmul(Q, K.T) / np.sqrt(d_k)
    attention_weights = np.exp(scores) / np.sum(np.exp(scores), axis=1, keepdims=True)
    attention_output = np.matmul(attention_weights, V)
    return attention_output

全部评论

推荐最新楼层

12-24 16:01

虾皮信息_客户端开发工程师(准入职员工)

叠纸游戏内推，叠纸游戏内推码

前端面试问题：1. 自我介绍2. 低代码平台Blocksuit方案，这个技术选型的逻辑3. 物料和数据源连接是用什么样的解决方案，还追了一下数据源的获取4. 团队规模，负责的具体内容，职责之类的5. 你认为前端工程化包括哪些方面？你具体做过哪些6. Git提交，你们有引入什么工具，检测方式来控制不规范提交7. 前端监控埋点方面有做过哪些吗8. 后面的职业规划9. 离职原因10. 排期和人手不够的情况，假设你作为leader，你怎么处理冲突？反问：1. 项目情况，技术栈2. 面试流程叠纸游戏26届秋校+27届nova训练营热力全开！🎮我们是：叠纸游戏成立于2013年8月，是一家专注于内容创作的...

点赞评论收藏

分享

12-22 21:18

蚌埠坦克学院嵌入式软件开发

提前实习好处就是赚米

提前实习可以赚钱，对很多学生来说，这不仅是积累工作经验的机会，也是一条实际收益的途径。通过提前进入职场实习，学生可以将课堂所学与真实项目结合，提前熟悉企业流程和职业要求，同时获得一定报酬。这种经验既可以减轻经济压力，也能让个人在毕业前就具备一定的竞争力。提前实习的收入虽然不一定很高，但对于理财和生活支出都有帮助，同时还能为将来的正式工作积累实战经验和人脉资源。总的来说，提前实习既能学习成长，又能赚钱，是学生迈向职场的一种双赢选择。

一人说一个提前实习的好处

点赞评论收藏

分享

12-06 17:39

中国石油大学（华东）前端工程师

求求让我找到实习吧

我的项目的代码都是ai写的，我是27届，想本科就直接就业，我学什么能找到工作啊，现在一个实习都找不到，求求大佬指点迷津😭😭😭

rbjjj：太杂了吧，同学，项目似乎都没深度，都是api调度耶，分层架构思想没有体现出来了，前端没有前端优化前端工程化体现，后端微服务以及分层架构没体现以及数据安全也没体现，核心再改改，注重于计算机网络，工程化，底层原理吧

点赞评论收藏

分享

12-24 20:42

西安邮电大学后端工程师

想进大厂暑期？这些东西你要准备好！

前言：我们会从五个维度开始介绍要求。分别是学历，八股，算法和实习，在校经历。当然了，不同的学历可能会在八股和算法这一块有不同的要求。这是一个很残酷的现实。如果你的学历比较弱。那你就要在其他方面付出更多的努力。对学历的要求  学历这一块我们已经改变不了了。因此我只介绍一下不同学历的现状。从事实上来讲，当你拥有一个比较好的985/211学历的时候，你就是可以很轻松的就进入大厂实习。这是你高中努力学习应得的。因此不用过于焦虑。  最近我在牛牛频道中总是看见很多985/211的同学焦虑自己在暑期实习之前没有一段日常会不会导致自己暑期找不到大厂实习。真的不用有这个担心。  能找到肯定是加分项。但是找不到...

代码之外的生存之道

点赞评论收藏

分享

评论

2

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客2025仙途报告 #

3352次浏览 103人参与

# 工作两年，想和老板谈涨薪怎么说 #

38748次浏览 175人参与

# 2025年终总结 #

176393次浏览 2981人参与

# 你面试体验感最差/最好的公司 #

21394次浏览 350人参与

# 秋招落幕，你是He or Be #

14761次浏览 279人参与

# 一人说一个提前实习的好处 #

13037次浏览 219人参与

# 礼物开箱Plog #

1322次浏览 56人参与

# 今年你最想重开的一场面试是？ #

5188次浏览 73人参与

# 重来一次，你会对开始求职的自己说 #

6736次浏览 165人参与

# 找工作，行业重要还是岗位重要？ #

85635次浏览 1699人参与

# 实习没事做是福还是祸？ #

18362次浏览 268人参与

# 机械制造秋招总结 #

97330次浏览 878人参与

# 团建是“福利”还是是 “渡劫” #

7948次浏览 158人参与

# 工作中听到最受打击的一句话 #

7857次浏览 123人参与

# 考公VS就业，你怎么选？ #

88071次浏览 496人参与

# 移动求职进展汇总 #

17895次浏览 143人参与

# 网易求职进展汇总 #

172485次浏览 1422人参与

# 你小心翼翼的闯过多大的祸？ #

11796次浏览 172人参与

# 哪些行业值得去? #

14370次浏览 74人参与

# 国央企薪资爆料 #

136564次浏览 597人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务