返回列表 发布新帖

[文化科学教育体育] 多数据源环境下的数据质量量化方法

10 0
admin 发表于 2024-12-1 15:39 | 查看全部 阅读模式

多数据源环境下的数据质量量化方法.pdf
提出了一种在背景范围内的数据质量量化方法QDC(QuantifyDimensionswithinContext)。数据质量可以用数据和其对应实体的“完美表达”间的差距来衡量,由于“完美表达”很难获得或代价很高。因此提出在多数据源条件下,数据的“完美表达”可以在其背景范围内用其“最近似”来替代,从而确定了数据质量评估参照的标准。同时,利用信息论中信息熵的概念,将不同类型数据的质量维度统一为通用的量化指标。作为一种自动化的数据质量评估方法,QDC方法不仅能够对数据的准确性和完整性维度给出准确的评估值,并且具有很高的计算效率。
作者:HANJingyu 韩京宇 JIANGDawei 江大伟
作者单位:DepartmentofComputer,NanjingUniversityofPostsandTelecommunications,Nanjing210003;DepartmentofComputerScienceandEngineering,SoutheastUniversity,Nanjing210096南京邮电大学计算机学院,南京,210003;东南大学计算机科学与工程学院,南京,210096DepartmentofComputer,NanjingUniversityofPostsandTelecommunications,Nanjing210003东南大学计算机科学与工程学院,南京,210096
母体文献:第19届全国计算机新科技与计算机教育学术大会论文集
会议名称:第19届全国计算机新科技与计算机教育学术大会  
会议时间:2008年8月2日
会议地点:黄山
主办单位:全国高等学校计算机教育研究会,中国计算机学会
语种:chi
分类号:
关键词:数据处理  多数据源环境  信息熵  量化分析
在线出版日期:2013年5月28日
基金项目:
相似文献
相关博文
2024-12-1 15:39 上传
文件大小:
238.09 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表