目前在上海人工智能实验室兼职实习;发表了多篇论文,涉及视频理解,音视频分析与处理和多模态表征学习等领域,并担任了多个国际顶级会议/期刊的审稿人;当前的研究兴趣主要集中在大语言模型的工具调用以及多模态人机交互,代表工作有InternGPT和ControlLLM,这些工作旨在通过工具,使语言模型不仅能获取更新的外部知识,同时能跨模态与人进行交互。