首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
你怎么把 Transformer 用到图像任务上的?和 CN
[问答题]
你怎么把 Transformer 用到图像任务上的?和 CNN 相比优劣在哪些场景体现?
添加笔记
求解答(0)
邀请回答
收藏(0)
分享
纠错
1个回答
添加回答
0
klro
ViT Transformer:图像分块:将图像划分为多个patch。线性输入:每个patch通过线性投影映射到D维向量上(一个长度为x的token序列,每个序列代表一个patch)。添加位置编码:使用可学习的位置编码,告诉模型每个patch的空间位置。4.引入分类token:在序列开头添加一个特殊token,用于最终分类。 Transformer:大数据预训练,迁移学习,适合全局上下文理解的任务。CNN:小数据量训练,实时部署,局部特征主导的任务。
发表于 2026-01-22 16:12:44
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
2025年-华为-AI...
难度:
1条回答
0收藏
143浏览
热门推荐
相关试题
你在项目里具体怎么用过贝叶斯概率?...
评论
(0)
来自
2025年-华为-AI算...
不借助深度学习框架,直接用 num...
评论
(0)
来自
2025年-华为-AI算...
什么是梯度爆炸和梯度消失?它们的原...
评论
(1)
来自
2025年-华为-AI算...
给我讲讲多头注意力的计算流程与复杂...
评论
(0)
来自
2025年-华为-AI算...
KV Cache 在训练和推理中的...
评论
(0)
来自
2025年-华为-AI算...
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题