高精度的轻量化视频目标检测

课程回放

高精度的轻量化视频目标检测

目标检测与识别专题讲座 2021/12/08 19:00:00

课程讲师

孙冠雄英国贝尔法斯特女王大学在读博士

研究方向包括视频目标检测、跟踪、识别等多任务的统一框架；本科和硕士毕业于哈尔滨工业大学计算机学院。

孙冠雄

英国贝尔法斯特女王大学在读博士

研究方向包括视频目标检测、跟踪、识别等多任务的统一框架；本科和硕士毕业于哈尔滨工业大学计算机学院。

课程提纲

视频目标检测的发展现状
轻量化的多级特征聚合视频目标检测框架MAMBA
在ImageNetVID 数据集上的速度与精度表现

课程简介

谈到目标检测模型，大家可能都不陌生，像YOLOv1 - YOLOv5，SSD、R-CNN、Faster R-CNN，及最近大火的YOLOX等，但这些目标检测算法仍以二维图像的目标检测为主，对于自动驾驶、机器视觉和视频监控领域并不适用。因此，延伸出许多针对特定场景的目标检测算法，像视频目标检测、行人检测、人脸检测、文本检测等。

视频目标检测是图像目标检测在视频领域的自然延伸，因为视频的本质还是连续的图像，视频目标检测的基本原理与图像目标检测是一样的。视频数据由大量连续图像组成，数量多，相邻图像之间的像素变化较小，存在大量的冗余信息。若将视频数据逐帧分解，直接输入图像目标检测的模型进行训练，庞大的计算量会严重影响检测速度，导致检测结果毫无实际应用的价值，且无法解决视频数据运动模糊、视频离焦、不寻常的姿态或物体遮挡等问题。那如何设计一个兼具速度与精度的目标检测器呢？

12月8日晚7点，英国贝尔法斯特女王大学孙冠雄博士将围绕《高精度的轻量化视频目标检测》这一主题，详细讲解了一种实现速度与精度兼得的视频目标检测框架MAMBA。

MAMBA通过构造轻量级的关键特征集和细粒度的特征更新策略，显着降低计算成本。同时，提出了一种广义增强操作GEO，GEO以统一的方式增强互补的像素级和实例级特征。在 ImageNet VID 数据集上，准确率达到 84.6%mAP，速度为110.3 毫秒。

孙冠雄是英国贝尔法斯特女王大学在读博士，研究方向包括视频目标检测、跟踪、识别等多任务的统一框架，本科和硕士毕业于哈尔滨工业大学计算机学院。

「目标检测与识别专题讲座」将在智东西公开课知识店铺进行，包含主讲和问答两个部分，其中主讲环节40分钟，问答环节20分钟。讲座将组建交流群，并邀请讲师加入，欢迎感兴趣的朋友申请。

精彩问答

提问

目前还没有问题，可以点击右侧的“提问按钮”提问

{{item.name}}
{{item.createdDate}}

{{item.answerOmit}} 阅读全文〉

更多问题...