文档摘要:基于深度学习的中医舌色分类模型具备良好的性能,但是依赖大量正确标注的样本.由于人工标注样本费时费力,不可避免地存在错误标注,导致模型在训练过程中对噪声样本过拟合,使其泛化能力变差.为此,本文提出了一种基于噪声样本渐近修正的中医舌色分类方法.首先,根据舌色分类的特点,提出了一种全局-局部特征融合方法,将其嵌入到ResNet18骨干网络中,构建了舌色分类网络,并采用集成学习范式,提高分类模型的可靠性和稳定性;其次,针对噪声样本下的舌色分类网络训练问题,提出了样本注意力机制和噪声样本标签重新标注机制,在训练过程中对干净样本和噪声样本加以区分,赋予不同的权重,并逐步对噪声样本标签进行修正;最后,采用Boostrapping损失函数降低模型对噪声样本的关注度,抑制噪声样本对分类性能的影响.将提出的方法在两个自建的舌色分类数据集上进行了实验验证,结果表明,该方法通过渐进地对噪声标签进行校正,可以获得比现有的有噪样本下图像分类方法更高的分类精度,Acc指标分别达到了94.6%和93.65%.
Abstract:AutotonguecolorclassificationisanimportantresearchtopicinthestudyofTCM(TraditionalChineseMedicine)objectification.Affectedbyvariousfactorssuchasdoctor'sexperienceandilluminationconditions,thereoftenexisterrorsinthemanuallyannotatedlabels,thatis,noisylabels.Noisylabelswillcausethemodelnottoconvergeinthetrainingprocessandthegeneralizationabilitywillbepoor.Therefore,inthispaper,aTCMtonguecolorclassificationmethodisproposedbyprogressivelycorrectingnoisysamples.First,accordingtothecharacteristicsofthetonguecolorclassification,aglobal-localfeaturefusionmethodisproposed,whichisembeddedintheResNet18backbonenetwork,con-structingatonguecolorclassificationnetwork.Theensemblelearningparadigmisadoptedtoimprovethereliabilityandstabilityoftheclassificationmodel.Next,fortheclassificationnetworktrainingproblemundernoisysamples,asampleat-tentionmechanismandare-labelingmechanismareproposed.Duringthetrainingprocess,differentweightsareassignedtocleansamplesandnoisysamples,andthenoisysamplesaregraduallyadjusted.Finally,thenetworkmodelisoptimizedandtrainedwiththeBoostrappinglossfunctiontosuppresstheimpactofnoisysamplesontheclassificationperformance.TheexperimentalresultsontwotonguecolorclassificationdatasetsSIPL-AandSIPL-Bshowthat,theproposedmethodcaneffectivelycorrectnoisylabels,thereby,significantlyimprovingthetonguecolorclassificationaccuracy.Comparedwiththeexistingimageclassificationmethodsundernoisysamples,theproposedmethodcanachieveahigherclassificationaccuracy,reaching94.6%and93.65%,respectively.
作者:孙亮亮 李艳萍 张辉 卓力Author:SUNLiang-liang LIYan-ping ZHANGHui ZHUOLi
作者单位:北京工业大学信息学部,北京100124;北京工业大学计算智能与智能系统北京重点实验室,北京100124
刊名:电子学报 ISTICEIPKU
Journal:ActaElectronicaSinica
年,卷(期):2024, 52(5)
分类号:TP391
关键词:中医舌色分类 噪声样本 样本注意力机制 重新标注机制 Boostrapping损失
Keywords:TCMtonguecolorclassification noisysample sampleattentionmechanism re-labelingmechanism boostrappingloss
机标分类号:TP391.41TP181P237
在线出版日期:2024年7月22日
基金项目:基于噪声样本渐近修正的中医舌色分类方法[
期刊论文] 电子学报--2024, 52(5)孙亮亮 李艳萍 张辉 卓力基于深度学习的中医舌色分类模型具备良好的性能,但是依赖大量正确标注的样本.由于人工标注样本费时费力,不可避免地存在错误标注,导致模型在训练过程中对噪声样本过拟合,使其泛化能力变差.为此,本文提出了一种基于噪声...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:中医舌色分类,噪声样本,样本注意力机制,重新标注机制,Boostrapping损失,
- 文件大小:
- 1.97 MB
- 下载次数:
- 60
-
高速下载
|
|