品玩 6 月 7 日讯,OPPO 研究院近日发表论文,介绍了一款专注图片标记的基础模型 Recognize Anything Model ,简称为 RAM。
据论文表示,RAM 中引入了一种全新的图像标记范例,对大规模图像文本进行训练,以此来代替传统的手动注释。
论文表示,通过评估测试,团队认为 RAM 在图片标记方面有着令人印象深刻的性能,其能力优于 CLIP 和 BLIP。
品玩 6 月 7 日讯,OPPO 研究院近日发表论文,介绍了一款专注图片标记的基础模型 Recognize Anything Model ,简称为 RAM。
据论文表示,RAM 中引入了一种全新的图像标记范例,对大规模图像文本进行训练,以此来代替传统的手动注释。
论文表示,通过评估测试,团队认为 RAM 在图片标记方面有着令人印象深刻的性能,其能力优于 CLIP 和 BLIP。