opencv 图像 抠图 算法_人工智能 | 不用绿幕也能实时抠图,商汤等提出只需单张图像、单个模型的新方法MODNet...
openEA开源周刊
openEA开源社区的官方运营载体
这里每天给大家呈现有价值的开源资讯,欢迎您的来稿与推荐,点击上方蓝色字,加入我们吧!
摘要:近日,香港城市大学和商汤提出一种新型人像抠图方法 MODNet,不用绿幕、只用单张图像、单个模型即可实时完成人像抠图。
openEA开源社区(ID:openEA)| 出品
小夕 | 编辑
机器之心 | 来源
选自arXiv
作者:Zhanghan Ke 等没有绿幕怎么抠图?此前,华盛顿大学的研究人员提出用背景图替换 trimap,不用绿幕也能实现不错的抠图结果。但该方法需要处理和对齐原始图像和背景图两张图像,不便于现实应用。近日,香港城市大学和商汤提出一种新型人像抠图方法 MODNet,不用绿幕、只用单张图像、单个模型即可实时完成人像抠图。人像抠图即预测一个精确的前景蒙版(alpha matte),然后利用它从给定图像或视频中提取人物。这一技术得到了广泛的应用,如照片编辑、电影再创作等。目前,实时获得高质量前景蒙版仍需要绿幕的辅助。但如果没有绿幕呢?目前大部分抠图方法使用预定义 trimap 作为先验。但,trimap 需要人类标注,所需成本高昂,并且如果是通过深度相机捕获,还会出现低精度问题。因此,近期的一些工作尝试消除模型对 trimap 的依赖,即 trimap-free 方法。例如,华盛顿大学提出的 background matting 方法用分离背景图像来替代 trimap。其他方法使用多个模型先生成伪 trimap 或语义掩码,然后将其作为先验进行前景蒙版预测。但使用背景图像作为输入需要输入并对齐两张图像,使用多个模型会使推断时间显著增加。这些缺陷使得前述所有抠图方法不适用于现实应用,如相机预览。此外,受到标注训练数据不足的限制,trimap-free 方法在实践中常遇到域偏移问题,即模型无法很好地泛化至现实数据。能不能只用一个模型、一张 RGB 图像,来预测精确的前景蒙版呢?最近,香港城市大学和商汤合作提出了一种轻量级网络 MODNet,它将人像抠图任务分解成三个相关的子任务,并通过特定约束执行同步优化。先来看一下 MODNet 的抠图效果:MODNet 模型背后存在两种洞见:一,神经网络更擅长学习一组简单目标,而不是一个复杂目标。因此,解决多个抠图子目标可以实现更好的性能。二,对每个子目标应用显式监督信号,可以使模型的不同部分学习解耦的知识,从而实现一个模型解决所有子目标。为了克服域迁移问题,该研究基于子目标一致性 (SOC) 提出了一种自监督策略,即利用子目标之间的一致性来减少预测前景蒙版中的伪影。此外,该研究还提出单帧延迟 (OFD) trick 这种后处理方法,以在视频抠图应用中获得更流畅的输出。MODNet 框架参见下图:相比 trimap-free 方法,MODNet 具备以下优势:MODNet 更快:它专为实时应用而设计,输入大小为 512 × 512 时,MODNet 在 Nvidia GTX 1080Ti GPU 上的运行速度为 63 fps;
MODNet 获得了新的 SOTA 结果,原因在于:1)目标分解和同步优化;2)对每个子目标应用特定的监督信号;
MODNet 具备更好的泛化能力,这得益于 SOC 策略。
低分辨率分支用于估计人类语义(监督信号是真值蒙版的缩略图);
高分辨率分支用于辨别人像边界(监督信号是过渡区域 (α ∈ (0, 1));
融合分支用来预测最终的前景蒙版(监督信号是整个真值蒙版)。
论文链接:https://arxiv.org/pdf/2011.11961.pdf
项目地址:https://github.com/ZHKKKe/MODNet
小贴士:
目前openEA应用市场已经上线啦,如果你手头上刚好有开源项目,欢迎到我们这里展示!
同时周刊已增设开源工具栏目,欢迎联系开源君投稿哦~
开源社区福利多多,欢迎登陆openea.net注册会员哦!
END
/openEA
开源社区统一认证方案(上)——CAS与LDAP的搭建与集成
/企业应用
让复杂的差旅费用报销简单起来
扫码关注公众号
新浪微博:@openEA开源社区
总结
以上是生活随笔为你收集整理的opencv 图像 抠图 算法_人工智能 | 不用绿幕也能实时抠图,商汤等提出只需单张图像、单个模型的新方法MODNet...的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 光栅衍射主极大个数_大学物理——光的干涉
- 下一篇: win10怎么把c盘锁住_win10如何