阿里优酷 视觉算法 一面 30分钟
5.10面的,面试官没开摄像头,也没算法题,30分钟一到直接结束(牛魔的)。一开始面试官就说时间比较紧。结果不用多说。。
PSNR、SSIM还有LPIPS的区别
对比学习核心它是什么
两个数据集,它是两个分布,但这两个之间的这种相似度怎么去衡量?就比方说像那种生成类的,像那个干这种从噪声生成图片,生成图片的这种真实度我怎么去衡量?
你这些损失函数对训练效果分别有什么影响(我菜,会的佬评论区教一下,我用的是Charbonnier loss,Codebook loss.Perceptual loss,Adversarial loss)
SEB为什么不能用交叉注意力来替代
场景题开始(没见过问这么多场景题的):
视频增强和超分怎么利用时序信息
你是只给了我一个单帧的检测结果是吧,然后你比方说检测到了一个飞机,我想让你给我的这个结果是包含了这个飞机在这个视频里面的完整的运动轨迹。比如说他的位置什么的,这些想让你给我更多的信息,你应该怎么做?每一帧的结果我都要。(我随便扯。)
最简单的方式,你就把每一帧的检测结果都给我,对吧但这肯定他不是一个track,他没有联系起来,而且他还有可能有漏检误检的情况,那这些情况怎么处理?
无算法。
#阿里##实习##算法##我的实习日记##我的实习求职记录##面经#
PSNR、SSIM还有LPIPS的区别
对比学习核心它是什么
两个数据集,它是两个分布,但这两个之间的这种相似度怎么去衡量?就比方说像那种生成类的,像那个干这种从噪声生成图片,生成图片的这种真实度我怎么去衡量?
你这些损失函数对训练效果分别有什么影响(我菜,会的佬评论区教一下,我用的是Charbonnier loss,Codebook loss.Perceptual loss,Adversarial loss)
SEB为什么不能用交叉注意力来替代
场景题开始(没见过问这么多场景题的):
视频增强和超分怎么利用时序信息
你是只给了我一个单帧的检测结果是吧,然后你比方说检测到了一个飞机,我想让你给我的这个结果是包含了这个飞机在这个视频里面的完整的运动轨迹。比如说他的位置什么的,这些想让你给我更多的信息,你应该怎么做?每一帧的结果我都要。(我随便扯。)
最简单的方式,你就把每一帧的检测结果都给我,对吧但这肯定他不是一个track,他没有联系起来,而且他还有可能有漏检误检的情况,那这些情况怎么处理?
无算法。
#阿里##实习##算法##我的实习日记##我的实习求职记录##面经#
全部评论
佬,去哪里了
相关推荐
点赞 评论 收藏
分享