文档摘要:人工智能技术在工业、医疗和金融等领域得到了广泛应用,并取得了巨大的成功.工业实体抽取任务是实现工业领域数字化转型的关键一环,然而其实现往往需要大量的数据支持,而这些数据往往分布在各个机构或组织之间.各行各业都产生了海量的有价值的数据,但是在实际的应用场景中,安全隐私、法律法规和行业竞争等多种因素往往导致各方的数据不能共享,从而形成所谓的"数据孤岛".针对这一问题,联邦学习提供了一种解决方案,可以有效解决数据孤岛问题,但联邦学习目前仍然面临一些问题和挑战,其中最典型的问题就是数据异构问题.针对各行各业存在的数据孤岛问题以及联邦学习本身的数据异构问题,本文以工业领域实体抽取任务为对象研究联邦学习的异构问题,从本地优化的角度提出了一种基于本地修正的联邦学习算法FedAmend,改善该联邦学习框架在面对工业领域数据非独立同分布时的表现,并在某汽车集团的工业设备故障数据上验证了FedAmend的可行性.
Abstract:ArtificialIntelligence(AI)technologieshavebeenwidelyusedwithgreatsuccessintheindustrial,healthcareandfinancialsectors.Theindustrialentityextractiontaskisakeypartofachievingdigitaltransformationintheindustrialsector,yetitsrealizationoftenrequiresthesupportofalargeamountofdata,whichisoftendistributedamongvariousinstitutionsororganizations.Allindustriesgeneratehugeamountsofvaluabledata,butinactualapplicationscenarios,security,privacy,lawsandregulations,andindustrycompetitionoftenleadtotheformationofso-called"datasilos"wheredatacannotbeshared.Toaddressthisproblem,FederatedLearningprovidesasolutionthatcaneffectivelysolvetheproblemofdatasilos,butFederatedLearningisstillfacinganumberofproblemsandchallenges,themosttypicalofwhichistheproblemofdataheterogeneity.Aimingatthedatasiloproblemexistinginvariousindustriesandthedataheterogeneityproblemoffederatedlearningitself,thispaperstudiestheheterogeneityproblemoffederatedlearningwiththeentityextractiontaskintheindustrialdomainastheobject,proposesafederatedlearningalgorithmFedAmendbasedonlocalcorrectionfromtheperspectiveoflocaloptimization,improvestheperformanceofthisfederatedlearningframeworkinthefaceofthenon-independentandhomogeneousdistributionofthedataintheindustrialdomainandverifiestheperformanceofthisfederatedlearningalgorithmonindustrialequipmentfailuredataofanautomobilegroup.ThefeasibilityofFedAmendisverifiedontheindustrialequipmentfailuredataofanautomobilegroup.
作者:傅圣泽Author:FUShengze
作者单位:上海工程技术大学电子电气工程学院,上海201620
刊名:智能计算机与应用
Journal:IntelligentComputerandApplications
年,卷(期):2024, 14(7)
分类号:TP391
关键词:实体抽取 联邦学习 数据异构 本地优化
Keywords:entityextraction federatedlearning dataheterogeneity localoptimization
机标分类号:TP301.6TN925.93O224
在线出版日期:2024年7月22日
基金项目:面向工业实体抽取的联邦学习优化算法[
期刊论文] 智能计算机与应用--2024, 14(7)傅圣泽人工智能技术在工业、医疗和金融等领域得到了广泛应用,并取得了巨大的成功.工业实体抽取任务是实现工业领域数字化转型的关键一环,然而其实现往往需要大量的数据支持,而这些数据往往分布在各个机构或组织之间.各行各业都...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:实体抽取,联邦学习,数据异构,本地优化,
|
|