基于Transformer的单阶段伪装实例分割模型OSFormer

课程回放

智猩猩AI新青年讲座 2022/09/05 19:00:00

课程讲师

裴佳伦华中科技大学在读博士

起源人工智能研究院（IIAI）Online Intern；研究兴趣集中在计算机视觉、实例分割、伪装/显著性检测等，已在ECCV、IEEETMM等会议和期刊上发表多篇论文。

裴佳伦

华中科技大学在读博士

起源人工智能研究院（IIAI）Online Intern；研究兴趣集中在计算机视觉、实例分割、伪装/显著性检测等，已在ECCV、IEEETMM等会议和期刊上发表多篇论文。

课程提纲

伪装物体检测的研究背景
伪装实例分割的难点
伪装实例分割模型OSFormer的设计
与二阶段框架的对比及模型表现

课程简介

伪装物体检测（COD）致力于区分与背景高度相似的伪装物体，然而COD只能在区域层面将伪装物体从场景中分离出来，而忽略了实例级的识别。与一般的实例分割相比，伪装实例分割需要在特征相似度较高、更复杂的场景下进行，并且获得的掩膜是不可知的。此外，多个伪装实例在场景中可能显示出不同的伪装策略，组合起来还可能形成交互伪装，这些衍生的群体伪装使得伪装实力分割任务更加艰巨。

为了对伪装场景进行更具体地分析和理解，解决伪装实例分割问题，华中科技大学在读博士裴佳伦提出基于Transformer的单阶段伪装实例分割模型OSFormer。

OSFormer通过设计位置感知Transformer（LST）来动态捕捉不同位置的实例线索，该LST模块还包含一个带有混合卷积前馈网络的编码器和带有位置引导查询的解码器，前者用来提取多尺度全局特征，后者实现实例感知嵌入。使用LST还能在有限的训练数据下实现快速收敛。

同时，为了整合来自主干和LST的多尺度低级和高级特征，裴佳伦博士还设计一种从粗到细的融合（CFF），嵌入反向边缘注意模块来捕捉伪装实例的边缘。引入动态伪装实例归一化（DCIN），结合高分辨率掩码特征和实例感知嵌入来生成掩码，预测伪装实例。

与两阶段框架相比，OSFormer在COD10K数据集上取得41%的AP，并且在不需要大量训练数据的情况下实现了良好的收敛速率。

9月5日晚7点，「AI新青年讲座」第154讲邀请到华中科技大学在读博士裴佳伦参与，主讲《基于Transformer的单阶段伪装实例分割模型OSFormer》。

精彩问答

提问

目前还没有问题，可以点击右侧的“提问按钮”提问

{{item.name}}
{{item.createdDate}}

{{item.answerOmit}} 阅读全文〉

更多问题...