返回列表 发布新帖

面向数据集成的多真值发现算法

9 0
admin 发表于 2024-12-11 09:44 | 查看全部 阅读模式

文档名:面向数据集成的多真值发现算法
大数据时代,大规模数据往往由多个数据源组成并服务于多个数据驱动型应用程序.由于数据源的可信度不同,不同数据源往往会产生数据冲突,使得难以判断哪些信息是真实的.近年来,真值发现方法通过从多个数据源中找到最符合现实的真值来解决冲突而成为研究热门.当前真值发现算通常假设实体某个属性只有一个真值,然而在现实中,实体具有多个真值的情况更为常见.针对多值实体,本文提出了一个多真值发现算法,该算法将多真值发现转化为一个最优化问题.根据对目标函数的求解选取置信度最高的多个值作为实体的真值.同时在计算描述值的置信度时,提出一种非对称的支持度计算方法,结合相似值的支持对其置信度进行修正.通过两个真实数据集上的实验表明本文算法的准确性优于现有的真值发现算法.
作者:陈烈锋许青林
作者单位:广东工业大学计算机学院,广州中国510006
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议  
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:TP3F83
关键词:数据集成  多真值发现  置信度
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
2024-12-11 09:44 上传
文件大小:
513.83 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表