CVPR 2023 | 基础模型推动语义分割的弱增量学习

作者:demo2024.03.04 06:32浏览量:5

简介:在CVPR 2023中,一篇论文提出了一种名为FMWISS的语义分割框架,该框架利用基础模型来改进弱增量学习,从而更有效地利用图像级标签对新类别的监督。本文将深入探讨该框架的工作原理和实际应用。

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

面向慢思考场景,支持低代码配置的方式创建“智能体Pro”应用

立即体验

在计算机视觉领域,语义分割是识别图像中各个物体的关键任务之一。随着新类别的不断出现,如何有效地进行增量学习以适应新的类别是一个具有挑战性的问题。在CVPR 2023中,一篇论文提出了一种名为FMWISS的语义分割框架,该框架旨在改进弱增量学习,更有效地利用图像级标签对新类别的监督。

该框架的创新之处在于它尝试利用互补的基础模型来改善仅使用图像级别标签的监督。具体来说,它从预训练的基础模型中提炼出类别意识和类别无关的知识,生成密集的掩码,为原始图像标签提供密集的监督。这种基于预训练的共同分割方法能够更好地定位每个片段的细节,从而提高了WILSS的性能。

为了更有效地利用伪标签,该框架还采用了一个师生架构,并提出了密集对比损失。这种损失函数可以动态地优化嘈杂的伪标签,进一步提高模型的性能。此外,该框架还引入了基于内存的复制-粘贴增强技术,以弥补旧类的遗忘问题。这种技术通过复制旧类别的知识并将其粘贴到新类别中,可以进一步提高模型的性能。

为了提高掩码质量,该框架还提出了自监督预训练模型。这种模型可以通过无标签数据进行自我监督学习,从而在预训练阶段获得更多的上下文信息。这有助于提高模型对新类别的泛化能力,并进一步改善了模型的性能。

在实际应用中,FMWISS框架可以应用于各种场景,如自动驾驶、智能安防和医疗诊断等。例如,在自动驾驶中,该框架可以帮助车辆更好地识别行人、车辆和道路标志等物体,从而提高驾驶的安全性和准确性。在智能安防中,该框架可以帮助监控系统更准确地识别异常行为和物体,从而提高安全保障能力。在医疗诊断中,该框架可以帮助医生更准确地识别病变区域和器官,从而提高诊断的准确性和可靠性。

总之,CVPR 2023中的这篇论文提出了一种非常有前途的语义分割框架FMWISS。该框架利用基础模型来改进弱增量学习,更有效地利用图像级标签对新类别的监督。通过引入各种创新技术,如基于预训练的共同分割、密集对比损失和基于内存的复制-粘贴增强技术等,该框架可以显著提高语义分割的性能。未来,我们期待看到更多关于FMWISS框架的研究和应用,以进一步推动计算机视觉领域的发展。

article bottom image

相关文章推荐

发表评论