近年来,数字经济发展势头强劲,逐步成为推动我国高质量发展的重要力量。迎接数字时代,如何更好激活数据要素潜能?同盾科技专家表示,信息数据作为有价值的资产,在数据的采集、传输、存储和共享等各个环节都面临着新的安全风险与挑战,数据的隐私安全问题也是数字经济发展、社会组织管理、商业业务价值创造急需解决的痛点。
对此,同盾科技旗下人工智能研究院近期新获得国家知识产权局发明专利授权的“基于XGBoost的跨样本联邦学习、测试方法、系统、设备和介质”技术方案正是为解决这一类问题而生。同盾技术团队通过利用知识联邦,将散落在不同机构或部门的数据联合起来创造或挖掘出更全面、更有价值的知识,实现“数据可用不可见,知识共创可共享”的目的。
同盾科技在业内率先将知识联邦运用于XGBoost这一被广泛使用的机器学习模型,实现多方信息融合,从而共同构建XGBoost模型,在整个建模过程中,为联邦建模过程中提供数据的训练方与聚合方(指可以是训练方当中的一方或者所有训练方共同选择的某一其他机构或组织——作者注)通信的信息规模量小,且两者之间传输的信息不会泄漏训练方样本原始特征数据或标签数据。
据悉,在同盾方案中,当联邦建模结束后,每一参与方均可获得相同结构的联邦XGBoost模型,从而可进一步实现本地预测和推理。该方案可广泛应用于多领域的涉及到敏感数据的应用场景建模中,目前,在同盾科技人工智能研究院自主研发、基于知识联邦参考实现的智邦平台(iBond)上的实验结果来看,基于该方案的算法在建模精度与建模速度方面均比相关竞品提供的同类算法方案存在明显的优势。这主要是因为对于跨机构或部门的数据需要进行多方的安全建模,传统的联合建模思路是无法达到保护各方数据隐私的效果。
而同盾本次获得专利的方案在保护数据安全和隐私的同时,打破机构之间的障碍,能够安全地支持多方检索、计算、推理等功能,从而形成一个统一的知识框架和技术体系,在银行、保险、信托、互联网、政府及公共事务等一些需要知识融合、管理、使用的领域中有着巨大的应用潜力。
(原标题:同盾“基于XGBoost的跨样本联邦学习”获得国家发明专利授权)