09-17 16:48 门头沟学院算法工程师发布于上海

关注

[复盘]transformer block的完整流程

输入x，然后做归一化得到x_norm(具体实现是乘一个缩放系数)

对x_norm做三个投影K Q V

做attention softmax计算后得到包含上下文关系的context矩阵

对context做一次投影得到attn_out

最后再接入残差网络，作为attention部分的输出x1。其中x1=x+attn_out

＞
接下来就到了FFN的部分，这里普遍采用SwiGLU的结构。

首先对x1做归一化，得到x1_norm。

对x1_norm做两次投影得到a和 b

其中a还需要通过SiLU激活函数，得到a=a*sigmod(a)

然后对a,b进行逐元素乘，得到hidden

最后将hidden投影，得到输出out

到此，一个transformer的层就计算完了，这个out就成为了下一层的输入x

全部评论

推荐最新楼层

麻城理工学校深度学习

点赞回复分享

发布于 09-18 09:41 广东

09-17 00:22

西京学院深度学习

华子的AI岗是大厂里最好进的

技术面试简单，绝对不拷打，流程化面试。想投的找我。

点赞评论收藏

分享

08-25 17:21

门头沟学院测试开发

回想来时路又emo了.

记得那时候还是疫情,23年大三上学期刚开学,2月份,待在家里还没有去学校,在****上面找了第一份实习,是海康威视,第一次面试,紧张又兴奋,经过40分钟的交涉,邮箱收到了人生第一个offer,但当时由于疫情的原因,跟辅导员商量了很久,才同意去实习.在去往杭州的高铁上,自豪又兴奋,掺杂着一丝犹豫与担忧,好在后来,一切都还算顺利,实习了2个月的时间,后续也有了时间规划,认识了很多新的朋友,再后来去北京,再后来秋招,毕业,入职, 在深圳成为了新的一轮打工仔,望着人潮汹涌的地铁,迷茫但坚持着....

第X杯敬自己

点赞评论收藏

分享

09-19 16:23

字节跳动_后台开发(实习员工)

秋招日寄——B站一面

timeline 8.30 投递笔试时间冲突没做9.15一面（挂）1、实习和场景题40分钟。场景题与实习穿插。- 设计一个亿级用户量排行榜- 线上接口出现偶发性延迟高问题如何排查- 对于线上频发激增qps的处理2、八股5分钟，感觉在凑时间。- TCP和UDP区别- go的gc简单说说- 查看进程cpu和内存使用的指令- redis数据结构。3、无手撕。聊1年或者3年制规划（感觉有点踩雷，b站太wlb，别表现太牛马之前找实习和现在都感觉，总体感觉是有实习的话，八股会问少很多

查看8道真题和解析

点赞评论收藏

分享

不愿透露姓名的神秘牛友

09-02 17:41

985硕做测试大材小用了吗？

最近成为耐挂王了，开始突然自我怀疑985硕做测试真的大材小用了吗？很多人劝退我

在写总结的山羊很孤独：兄弟，你可以目标定在最厉害的测试

点赞评论收藏

分享

09-17 10:43

汉口学院活动策划执行

求大神指点

满分简历要如何准备？

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

美团秋招进展

热聊中

创作者周榜

更多

正在热议

更多

# 从顶到拉给所有面过的公司评分 #

50575次浏览 307人参与

# 小厂实习有必要去吗 #

57708次浏览 291人参与

# 宣讲会你有哪些意向不到的收获 #

7598次浏览 44人参与

# 产品薪资爆料 #

131994次浏览 840人参与

# 你面试被问到过哪些不会的问题？ #

44110次浏览 1153人参与

# 签约/解约注意事项 #

724013次浏览 4108人参与

# 水滴求职进展汇总 #

7154次浏览 36人参与

# 机械制造岗投递时间线 #

28968次浏览 372人参与

# 你怎么评价今年的春招？ #

131865次浏览 1369人参与

# 十一假期一定要干的事 #

19154次浏览 145人参与

# 你的国庆怎么过 #

28455次浏览 255人参与

# 你收到美的的感谢信了吗 #

43941次浏览 233人参与

# 为了求职，我做过的疯狂伪装 #

22845次浏览 479人参与

# 晒晒你的中秋福利 #

20072次浏览 141人参与

# 工作压力大怎么缓解 #

108760次浏览 1072人参与

# 顺丰求职进展汇总 #

57581次浏览 291人参与

# bilibili求职进展汇总 #

103690次浏览 876人参与

# 聊聊这家公司值得去吗 #

586501次浏览 3834人参与

# 职场破冰，你们都聊什么？ #

12947次浏览 99人参与

# 秋招的嫡长offer #

60072次浏览 484人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务