绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
高精度的轻量化视频目标检测
目标检测与识别专题讲座 2021/12/08 19:00:00
课程讲师
孙冠雄 英国贝尔法斯特女王大学 在读博士

研究方向包括视频目标检测、跟踪、识别等多任务的统一框架;本科和硕士毕业于哈尔滨工业大学计算机学院。

孙冠雄
英国贝尔法斯特女王大学 在读博士

研究方向包括视频目标检测、跟踪、识别等多任务的统一框架;本科和硕士毕业于哈尔滨工业大学计算机学院。

课程提纲
  • 视频目标检测的发展现状
  • 轻量化的多级特征聚合视频目标检测框架MAMBA
  • 在ImageNetVID 数据集上的速度与精度表现
课程简介

谈到目标检测模型,大家可能都不陌生,像YOLOv1 - YOLOv5,SSD、R-CNN、Faster R-CNN,及最近大火的YOLOX等,但这些目标检测算法仍以二维图像的目标检测为主,对于自动驾驶、机器视觉和视频监控领域并不适用。因此,延伸出许多针对特定场景的目标检测算法,像视频目标检测、行人检测、人脸检测、文本检测等。

视频目标检测是图像目标检测在视频领域的自然延伸,因为视频的本质还是连续的图像,视频目标检测的基本原理与图像目标检测是一样的。视频数据由大量连续图像组成,数量多,相邻图像之间的像素变化较小,存在大量的冗余信息。若将视频数据逐帧分解,直接输入图像目标检测的模型进行训练,庞大的计算量会严重影响检测速度,导致检测结果毫无实际应用的价值,且无法解决视频数据运动模糊、视频离焦、不寻常的姿态或物体遮挡等问题。那如何设计一个兼具速度与精度的目标检测器呢?

12月8日晚7点,英国贝尔法斯特女王大学孙冠雄博士将围绕《高精度的轻量化视频目标检测》这一主题,详细讲解了一种实现速度与精度兼得的视频目标检测框架MAMBA。

MAMBA通过构造轻量级的关键特征集和细粒度的特征更新策略,显着降低计算成本。同时,提出了一种广义增强操作GEO,GEO以统一的方式增强互补的像素级和实例级特征。在 ImageNet VID 数据集上,准确率达到 84.6%mAP,速度为110.3 毫秒。

孙冠雄是英国贝尔法斯特女王大学在读博士,研究方向包括视频目标检测、跟踪、识别等多任务的统一框架,本科和硕士毕业于哈尔滨工业大学计算机学院。

「目标检测与识别专题讲座」将在智东西公开课知识店铺进行,包含主讲和问答两个部分,其中主讲环节40分钟,问答环节20分钟。讲座将组建交流群,并邀请讲师加入,欢迎感兴趣的朋友申请。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...