- 课程回放

毕业于东北大学计算机科学与技术专业。擅长CV 算法与 Docker 部署;自加入 Zilliz 以来,致力于为 Milvus 开源项目探索各类计算机视觉方向的解决方案与教学工作,帮助了许多用户实现应用场景落地。

毕业于东北大学计算机科学与技术专业。擅长CV 算法与 Docker 部署;自加入 Zilliz 以来,致力于为 Milvus 开源项目探索各类计算机视觉方向的解决方案与教学工作,帮助了许多用户实现应用场景落地。

约克大学博士后,师从中国金融数学第一人彭实戈院士;曾在加拿大Maple Ridge Capital公司担任金融分析师;是科技部973重大项目“金融风险控制中的定量分析与计算”项目组的主要成员;现主持富数科技核心联邦学习、多方安全计算算法研究与产品化、富数Avatar隐私保护计算平台搭建等工作。

约克大学博士后,师从中国金融数学第一人彭实戈院士;曾在加拿大Maple Ridge Capital公司担任金融分析师;是科技部973重大项目“金融风险控制中的定量分析与计算”项目组的主要成员;现主持富数科技核心联邦学习、多方安全计算算法研究与产品化、富数Avatar隐私保护计算平台搭建等工作。
- 工业界中的数据隐私问题
- Intel SGX软件保护方案
- Avatar平台中的TEE联邦学习与算法逻辑保护实现
- Avatar安全计算平台的应用案例
- 如何分析非结构化数据
- 开源向量相似搜索引擎Milvus的框架解析
- 基于Intel AVX-512 的向量搜索优化
- Milvus的应用案例
互联网时代,一切源于数据。
随着人工智能技术的兴起,数据的质量和数量,已经成为了影响机器学习模型效果最重要的因素之一。然而数据在使用的过程中,也面临着诸多问题,如数据的隐私问题和数据的不规则、不完整等问题。
为了让大家更好的了解数据隐私与数据的非结构化问题,12月8日晚7点,智东西公开课联合英特尔推出了英特尔AI百佳创新激励计划数据智能专场,由英特尔AI百佳创新激励计划优秀企业代表富数科技和Zilliz共同参与。其中富数科技首席科学家陈立峰的讲解主题为《基于TEE增强的联邦学习与多方安全计算平台解析》,Zilliz 数据工程师李晴的讲解主题为《开源向量相似搜索引擎Milvus的框架与应用》。
数据的隐私问题一直是人们所关心的焦点问题。尤其是工业界来说,随着对数据安全的重视和隐私保护法案的出台,以前粗放式的数据共享受到挑战,各个数据拥有者重新回到数据孤岛的状态。
而如何解决数据孤岛,成为AI行业需要解决的首要问题之一。当前业界解决隐私泄露和数据滥用的数据共享技术主要有三条路线。一条是基于硬件可信执行环境(TEE:Trusted Execution Environment)技术的可信计算,TEE字面意思是可信执行环境,核心概念为以第三方硬件为载体,数据在由硬件创建的可信执行环境中进行共享。一条是基于密码学的多方安全计算(MPC:Multi-party Computation)。第三条路线是最新提出的一种人工智能基础技术-联邦学习(Federated Learning)。
国内对于数据共享场景的机器学习解决方案主要是联邦学习,那么如何基于TEE增强联邦学习并构建多方安全计算的平台呢?在本次的专场讲解中,陈立峰老师将会从工业界中的数据隐私问题出发,详解Intel SGX软件保护方案以及Avatar平台中的TEE联邦学习与算法逻辑保护实现,同时也会介绍一些Avatar安全计算平台的应用案例。
随着数据量的指数级增长,如何挖掘数据的价值成为了企业面临的巨大挑战。同时,现有的数据多为没有预定义的数据模型,不方便使用数据库二维逻辑表来表现的非结构化数据。其数据特征多为高纬度的特征,如描述图像视觉特征的数据基本是百维以上。
而随着深度学习算法在非结构化数据处理中的广泛应用,对深度学习模型的主要输出-高纬度特征向量,进行准确、高效的检索已经成为了数据分析中的关键问题。而“维度灾难”问题导致传统的树形高维索引性能急剧下降,在数据规模和检索性能上很难满足需求。
那么如何构建高效、方便、可扩展并可满足需求的搜索引擎呢?Ziliiz公司在2019年开源了一款面向非结构化数据近似检索和分析的向量搜索引擎。在本次的专场的讲解中,Ziliiz数据工程师李晴将会从非结构化数据的分析出发,向大家全面解析向量相似搜索引擎Milvus的框架以及基于Intel AVX-512的向量搜索优化,最后也会介绍到Milvus的应用案例。