传统cv想做多模态

目前是研一,马上研二。
只做过传统的cv,用过YOLO,做过人体关键点检测,图像分割,图像分类之类的内容。
nlp只做过比较简单的,像用RNN做文本分类,文本生成。
没做过文生图和图生文以及图生图。
目前想找多模态的实习,不知道应该如何准备。
感谢大佬在评论区指点!
大概有个方向了,还有个小小的疑问,只学理论不跑代码能找到多模态的实习吗?
或者有没有合适的练手开源项目推荐。
全部评论
从clip到bilp系列 flamingo llava系列 cogvlm系列 internvl系列都看一遍
8 回复 分享
发布于 2024-08-27 08:57 广东
可以看一下Rocky撰写的《三年面试五年模拟》系列文章
1 回复 分享
发布于 2024-08-28 10:09 浙江
秋招?
点赞 回复 分享
发布于 2024-08-25 11:07 北京

相关推荐

背景:9本28届机器人专业感觉小厂更看重你的综合项目能力,做过什么,中大厂应该就规范一些,八股,手撕,拷打简历​下面是这次的面经,主要还是问项目(之前的贴子有简历,欢迎投票指正)​1. 之前聊到PID,轮腿控制是两轮平衡车那种类型吗?讲讲你们具体PID的应用2. 这套轮腿设备是你自己做的吗?整体方案介绍​3. 你对IMU的数据处理,尤其是陀螺仪部分应该很熟悉吧?你的处理流程是什么?4. 那你后面也搞过小车的建图导航吧?具体讲讲5. 那常见的建图导航算法你应该都用过吧?6. 那你们的机械臂,是用开源的还是自己做的?7. 那机械臂的正逆解这块你也有经验吗?原理代码都熟悉吗?8. 那你们用的机械臂是什么形式的,几轴的?9. 那你在AI方面有了解吗?10. 那你自己也能做模型训练是吧?YOLO掌握到什么程度,有做过什么东西吗?11. 那深度相机你们用得熟练吗?熟悉到什么程度​反问:​1.公司主营业务​2.简历问题​3.我的半桶水水平有多少4.企业更看重什么能力​5.南京机器人相关公司情况怎么样,就业前景和生活体验以及人才引进政策呢?​感觉自己的不足:面试一开始容易紧张,每次说自己的个人信息和比赛,项目经历都口吃,应该整理文字版,逻辑清晰念熟练
查看11道真题和解析
点赞 评论 收藏
分享
评论
2
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务