- 课程回放
师从杨海龙副教授;当前研究方向为高性能优化、性能分析工具、编译优化。曾获世界大学生超算竞赛ASC17总决赛银奖、ASC18总决赛一等奖,欧洲大学生超算竞赛ISC17总决赛季军,获得第一届开源科学软件创意大赛二等奖、第二届开源科学软件创意大赛三等奖;以第一作者发表CCF A类顶会论文《ZeroSpy: Exploring Software Inefficiency with Redundant Zeros》(SC20)、《VClinic: A Portable and Efficient Framework for Fine-grained Value Profilers》(ASPLOS23),B类论文2篇,C类论文2篇,EI论文4篇,累计发表论文18篇;目前正在阿里DeepRec项目组实习。
师从杨海龙副教授;当前研究方向为高性能优化、性能分析工具、编译优化。曾获世界大学生超算竞赛ASC17总决赛银奖、ASC18总决赛一等奖,欧洲大学生超算竞赛ISC17总决赛季军,获得第一届开源科学软件创意大赛二等奖、第二届开源科学软件创意大赛三等奖;以第一作者发表CCF A类顶会论文《ZeroSpy: Exploring Software Inefficiency with Redundant Zeros》(SC20)、《VClinic: A Portable and Efficient Framework for Fine-grained Value Profilers》(ASPLOS23),B类论文2篇,C类论文2篇,EI论文4篇,累计发表论文18篇;目前正在阿里DeepRec项目组实习。
- 深度推荐模型在实际业务部署中的挑战
- 加速推理的多流并行及DeepRec框架
- 海量训练数据对深度推荐模型的要求
- 动态适配的图感知内存分配策略及训练
海量训练数据对深度推荐模型的要求
动态适配的图感知内存分配策略及训练