- 课程回放
2017年在香港中文大学获得博士学位,后进入商汤科技,负责自动驾驶激光雷达3D感知和通用图像感知等技术方向的研发;在领域顶级会议和期刊上发表40多篇论文,谷歌学术引用3000余次,曾参与业界著名的ImageNet目标检测,Davis视频分割和Waymo 3D目标检测等挑战获得第一。
- 自动驾驶通用目标感知体系构建的挑战
- 商汤绝影通用感知能力的三个维度
- 基于超大模型技术的车端小模型生产
- 实战应用
深度学习方法在计算机视觉领域的突破进展,致使自动驾驶中的感知问题也越来越多的采用深度学习模型依托大数据训练解决。感知模块也是现在深度学习应用在自动驾驶当中最成熟的模块,不论是理论研究还是各大厂商在实际驾驶环境中的应用都已具有一定的规模,学术界在自动驾驶领域的文章中占比最多的也是关于感知问题的。
自动驾驶L2+/L3功能的演进趋势,让自动驾驶感知面临着从单一场景到多重场景,从简单场景到复杂场景的挑战。场景覆盖度的提升,意味着对交通要素识别丰富度和长尾问题解决覆盖度的需求提升。面对如此复杂、多样化的任务需求,如何更快更低成本的进行AI研发,业内一个越来越明显的趋势就是大模型技术。大模型技术依托超大算力的训练支持,通过构建通用的大模型就可以完成成百上千种任务,体系化的解决数据、泛化、认知和安全等诸多瓶颈问题。
在SenseCore商汤AI大装置的支持下,商汤SenseAuto Empower绝影赋能引擎的开放感知平台,基于内嵌的通用视觉感知能力,可以在智能驾驶场景中,有效支持各类常见交通参与者和道路信息,以及路面标识、施工区域锥形筒、异形车及各类障碍物等长尾场景元素感知,且在雨、雪、雾等不同环境下均有稳定表现。
7月26日,商汤绝影联合智东西公开课策划推出「商汤绝影自动驾驶技术公开课」,商汤绝影总监王哲博士将围绕主题《自动驾驶通用目标感知体系的构建》,主讲自动驾驶通用目标感知能力及实战应用。
王哲是商汤绝影总监,2017年在香港中文大学获得博士学位,后进入商汤科技,负责自动驾驶激光雷达3D感知和通用图像感知等技术方向的研发。在领域顶级会议和期刊上,他曾发表40多篇论文,谷歌学术引用3000余次,曾参与业界著名的ImageNet目标检测,Davis视频分割和Waymo 3D目标检测等挑战获得第一。
在本次公开课,王哲博士将对自动驾驶通用目标感知体系构建的挑战进行分析,之后将从数据、算法和算力三个维度讲解商汤绝影通用感知能力的构建,以及基于超大模型技术的车端小模型生产。最后,他也将分享商汤绝影通用感知能力的实战应用。
「商汤绝影自动驾驶技术公开课」将以视频直播形式进行,包含40分钟主讲和20分钟问答。同时,针对本次公开课,也组建了主讲群,届时主讲人王哲博士将加入,欢迎感兴趣的朋友申请。