研究重点是高效/可扩展的人工智能,主要包含神经网络量化,知识蒸馏等具体技术;所提出的模型压缩方法被应用于等多种场景(后训练,zero-shot等)、不同结构(生成模型和大型语言模型)的网络中;工作成CVPR、ICCV、ECCV等会议上发表;此前在武汉大学获得应用数学和金融学双学士学位。