通义校招-算法工程师-多模态团队介绍:达摩院-基础视觉智能团队,在图像、视频、多模态方面的学术研究与产业落地均有丰富的积累,团队成员在CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/TPAMI/TIP等顶级会议/期刊发表多篇论文,在CVPR/ICCV等举办的Classifcation, Detection, Segmentation, Captioning, VQA,Video Understanding等任务获得多项世界冠军。方向:多模态大模型,利用大规模图文等多模态数据训练多模态预训练大模型,应用于多种视觉或多模态下游任务,如图像分类、图文检索、VQA问答、文本生成图像、视频生成、多模态对话等。要求:应届毕业硕博生;1. 有较强动手能力,熟练使用pytorch等深度学习工具;2. 曾在相关顶会发表高水平学术论文优先;3. 具备创新性解决问题的能力。感兴趣的请投递简历:lingchen.zlm@alibaba-inc.com