关于跨模态学习模型 CLIP(Contrastive Language-Image Pre-training),以下哪些说法是正确的?
CLIP 使用对比学习将图像和文本嵌入到同一个空间中
CLIP 可以用于零样本图像分类任务
CLIP 的训练需要配对的图像和文本标签数据
CLIP 只能用于分类任务,不能用于生成任务
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题