分割一切后,Segment Anything又能分辨类别了:Meta/UTAustin提出全新开放类分割模型|最新资讯
前几日,Meta 推出了「分割一切」AI 模型 Segment Anything,令网友直呼 CV 不存在了?!而在另一篇被 CVPR 2023 收录的论文中, Meta、UTAustin 联合提出了新的开放语言风格模型(open-vocabulary segmentation, OVSeg),它能让 Segment Anything 模型知道所要分隔的类别。
(资料图片仅供参考)
从效果上来看,OVSeg 可以与 Segment Anything 结合,完成细粒度的开放语言分割。比如下图 1 中 识别花朵的种类: sunflowers (向日葵)、white roses (白玫瑰)、 chrysanthemums (菊花)、carnations (康乃馨)、green dianthus (绿石竹)。
即刻体验:https://huggingface.co/spaces/facebook/ov-seg
项目地址:https://jeff-liangf.github.io/projects/ovseg/
研究背景
开放式词汇语义分割旨在根据文本描述将图像分割成语义区域,这些区域在训练期间可能没有被看到。最近的两阶段方法首先生成类别不可知的掩膜提案,然后利用预训练的视觉-语言模型(例如 CLIP)对被掩膜的区域进行分类。研究者确定这种方法的性能瓶颈是预训练的 CLIP 模型,因为它在掩膜图像上表现不佳。
为了解决这个问题,研究者建议在一组被掩膜的图像区域和它们对应的文本描述的收集的数据上对 CLIP 进行微调。研究者使用 CLIP 将掩膜图像区域与图像字幕中的名词进行匹配,从而收集训练数据。 与 具有固定类别的更精确和手动注释的分割标签(例如 COCO-Stuff)相比,研究者发现嘈杂但多样的数据集可以更好地保留 CLIP 的泛化能力。
除了对整个模型进行微调之外,研究者还使用了被掩膜图像中的「空白」区域,使用了他们称之为掩膜提示微调的方法。
实验表明,掩膜提示微调可以在不修改任何 CLIP 权重的情况下带来显著的改进,并且它可以进一步改善完全微调的模型。特别是当在 COCO 上进行训练并在 ADE20K-150 上进行评估时, 研究者的最佳模型实现了 29.6%的 mIoU,比先前的最先进技术高出 8.5% 。开放式词汇通用模型首次与 2017 年的受监督专家模型的性能匹配,而不需要特定于数据集的适应。
论文地址:https://arxiv.org/pdf/2210.04150.pdf
论文解读
动机
研究者的分析表明,预训练的 CLIP 在掩膜建议上表现不佳,成为两阶段方法的性能瓶颈。
CLIP 是使用很少的数据增强在自然图像上进行预训练的。
两阶段的开放词汇语义分割方法首先生成类别不可知的掩膜建议,然后利用预训练的 CLIP 进行开放词汇分类。 CLIP 模型的输入是裁剪的掩膜图像,与自然图像存在巨大的领域差距。
我们的分析表明,预训练的 CLIP 在掩膜图像上表现不佳。
方法研究者的模型 包括一个分割模型(例如 MaskFormer)和一个 CLIP 模型 。
他们首先训练修改后的 MaskFormer 作为开放词汇分割的基线(第 3.1 节),然后从图像标题中收集多样的掩膜-类别对(第 3.2 节),并适应 CLIP 用于掩膜图像(第 3.3 节)。
结果
研究者首次展示 开放词汇的通用模型可以在没有数据集特定调整的情况下与受监督的专业模型的性能相匹配 。
更多分类示例如下所示。
关键词:
-
分割一切后,Segment Anything又能分辨类别了:Meta/UTAustin提出全新开放类分割模型|最新资讯
2023-04-18 -
北京市朝阳区正源新亚学校英语课堂如何? -->
2023-04-18 -
2023年一季度国内生产总值284997亿元 同比增长4.5%
2023-04-18 -
全球热推荐:NBA官宣首轮签:火箭马刺活塞均14%获状元签争文班 湖人17号签
2023-04-18 -
2010亚运会男篮决赛录像(2010亚运会男篮决赛)_当前观点
2023-04-18 -
4月17日基金净值:华安新兴消费混合A最新净值0.6763,涨1.2%
2023-04-18 -
天天信息:热门中概股普涨,纳斯达克中国金龙指数涨超3%
2023-04-18 -
焦点资讯:东宇电气2022年净利837.55万同比增长1.01% 本期业务量增加
2023-04-18 -
世界百事通!国海证券:美国通胀初降温!有色金属价格上涨
2023-04-18 -
2023上海车展:商务接待新选手 静态体验魏牌高山 天天速看
2023-04-17 -
环球热议:新车报讯:全新宝马7系最新渲染图概念车将于9月慕尼黑车展亮相
2023-04-17 -
宝安北帝庙会明天举行,免费免预约!攻略路线在这里
2023-04-17 -
禅城投入700万元促消费!4月18日-5月5日将开展大型促消费活动
2023-04-17 -
速读:全球顶尖选手再现“百舸争流”,这项帆船赛事下月登陆上海
2023-04-17 -
留守儿童玩网游10多天充值近2万元 专家:网游平台应尽快实行“双认证系统”
2023-04-17 -
天天热门:玉米商品报价动态(2023-04-17)
2023-04-17 -
世界热推荐:四月手机价格“大跳水”,三款热门机型降价超1000元
2023-04-17 -
吉林省启动“千亿斤粮食”产能建设工程
2023-04-17 -
科技金融双向赋能 上海交大打造科技金融教育研究和人才高地_焦点热议
2023-04-17 -
要闻:小米13 Ultra真机外观公布 官图海报放出
2023-04-17 -
股东分红如何合理分配_每股未分配利润是什么意思
2023-04-17 -
【全球独家】2023年3月11日雅思听力考试题答案
2023-04-17 -
望海潮柳永赏析(望海潮柳永词)|精彩看点
2023-04-17 -
天天实时:泰豪科技董秘回复:公司合并范围内没有全称为“泰豪通信汽车有限公司”的子公司
2023-04-17 -
首都高校上好“国家安全”课_每日速读
2023-04-17 -
拿森CEO陶喆:国产替代趋势利好,5年后本土线控底盘商市场份额或超外资巨头
2023-04-17 -
200余件紫陶精品在沪亮相 “紫气东来·陶醉上海”建水紫陶文旅宣传月启动
2023-04-16 -
环球最新:浙江文旅观察:今天,我们该如何纪念汤显祖?
2023-04-16 -
【创业100】张辉面:一碗扯面卖到全国上百家店
2023-04-16 -
天天资讯:新华全媒+丨小田并大田:黄土高原上的春耕新图景
2023-04-16
-
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16 -
保持稳定发展有支撑——从11月“成绩单”看中国经济走势
2021-12-16