返回列表 发布新帖

特征增强的改进LightGBM流量异常检测方法

6 0
admin 发表于 2024-12-14 02:44 | 查看全部 阅读模式

文档名:特征增强的改进LightGBM流量异常检测方法
摘要:针对机器学习在流量异常检测中存在选择特征过于依赖专家经验、原始特征表达能力不足、数据受噪声和离群点影响导致模型鲁棒性差以及处理非平衡海量高维数据时少数异常类检测率低等问题,提出一种特征增强的改进LightGBM(lightgradientboostingmachine)流量异常检测方法.首先,采用隔离森林(isolationforest,iForest)实现异常值处理,并利用异常值处理后的数据训练引入全局平均池化(globalaveragepooling,GAP)的一维卷积去噪自编码器(convolutionaldenoisingautoencoder,CDAE),间接地消除数据中的噪声,得到原始特征的低维增强表达.然后,采用自适应合成采样(adaptivesynthetic,ADASYN)对异常值处理后的数据实现数据增强并运用训练完成的CDAE进行特征提取,将得到的低维特征作为LightGBM的输入,训练并进行贝叶斯参数寻优.最后,通过得到的CDAE+LightGBM组合模型实现对异常流量的精准分类.在NSL-KDD数据集上所提方法的五分类准确率和F1分数分别达到了87.80%和87.75%,能够有效提升检测精度,增强未知攻击的检测能力.在CICIDS2017场景数据集上的测试进一步验证了所提方法可行性,且优于与同类型的深度学习算法.

Abstract:Focusingontheproblemsofmachinelearningintrafficanomalydetection,includingrelianceonexpertexperienceforfeatureselection,insufficientexpressionabilityofrawfeatures,poorrobustnessofmodelsduetonoiseandoutliersindata,andlowdetectionratesforminorityclassesinimbalancedhigh-dimensionaldatasets,animprovedLightGBMforTrafficAnomalyDetectionMethodwithFeatureEnhancementisproposed.Firstly,theisolationforest(iForest)methodisutilizedtohandleoutliers,andthedataprocessedbyoutliertreatmentisusedtotrainanone-dimensionalconvolutionaldenoisingauto-encoder(CDAE)withglobalaveragepooling(GAP),whichindirectlyeliminatesnoiseinthedataandobtainslow-dimensionalenhancedexpressionsoforiginalfeatures.Then,adaptivesyntheticsampling(ADASYN)isappliedtothedataafteroutliertreatmentfordataaugmentation,andthetrainedCDAEisusedtoextractfeatures.Theobtainedlow-dimensionalfeaturesareusedasinputforLightGBM,whichistrainedandoptimizedwithBayesianparametertuning.Atlast,theprecisionclassificationofanomaloustrafficisachievedthroughtheutilizationoftheobtainedCDAE+LightGBMensemblemodel.Theproposedmethodattainsaccuracyratesof87.80%andF1scoresof87.75%inafive-classclassificationtaskontheNSL-KDDdataset.Experimentalresultsdemonstratethattheproposedapproachsignificantlyenhancesdetectionaccuracyandreinforcesthecapabilitytoidentifyunknownattacks.ThetestonCICIDS2017scenedatasetfurtherverifiesthefeasibilityoftheproposedmethod,whichsuperiortothesametypeofdeeplearningalgorithm.

作者:陈万志   赵林   王天元 Author:ChenWanzhi   ZhaoLin   WangTianyuan
作者单位:辽宁工程技术大学软件学院葫芦岛125105国网辽宁省电力有限公司营口115005
刊名:电子测量与仪器学报 ISTICPKU
Journal:JournalofElectronicMeasurementandInstrumentation
年,卷(期):2024, 38(3)
分类号:TP393TN911.7
关键词:流量异常检测  隔离森林  卷积去噪自编码器  自适应合成采样  LightGBM  
Keywords:trafficanomalydetection  isolationforest  convolutionaldenoisingauto-encoder  adaptivesyntheticsampling  LightGBM  
机标分类号:TP391TP181R394.3
在线出版日期:2024年7月8日
基金项目:国家重点研发计划,辽宁省教育厅高校科研基金项目特征增强的改进LightGBM流量异常检测方法[
期刊论文]  电子测量与仪器学报--2024, 38(3)陈万志  赵林  王天元针对机器学习在流量异常检测中存在选择特征过于依赖专家经验、原始特征表达能力不足、数据受噪声和离群点影响导致模型鲁棒性差以及处理非平衡海量高维数据时少数异常类检测率低等问题,提出一种特征增强的改进LightGBM(l...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        特征增强的改进LightGBM流量异常检测方法  Improved LightGBM for traffic anomaly detection method with feature enhancement

特征增强的改进LightGBM流量异常检测方法.pdf
2024-12-14 02:44 上传
文件大小:
6.48 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表