返回列表 发布新帖

基于分布式ElasticSearch相似内容比对算法研究

6 0
admin 发表于 2024-12-10 14:57 | 查看全部 阅读模式

文档名:基于分布式ElasticSearch相似内容比对算法研究
文中提出了一种基于ElasticSearch分布式搜索引擎文本相似度比对优化方案,该方法在ElasticSearch搜索引擎自身文本比对模型(TF-IDF模型)的基础上进行优化,以提高文本比对的精确度.在优化方法中通过配置远程词典、热更新词库和修改文本比对模型等方式,实现了语义匹配、近义词匹配、段落替换匹配.同时解决了ElasticSearch中词序替换不能匹配、语义替换不能匹配、新词不能识别的问题.同时,基于ElasticSearch搜索语法,提出了一种动态调整特殊位置的文本权重以提高文本主题比对精确度的方法.另外,该优化方案搭建了ElasticSearch集群,实现了文本的可靠访问和分散多分片存储,从而提高系统高可用、低延迟和容灾能力.
作者:马智勤 廖雪花 邓威 肖文超
作者单位:四川师范大学计算机科学学院成都610001四川师范大学物理与电子工程学院成都610001
母体文献:第十六届全国Web信息系统及其应用学术会议(WISA2019)论文集
会议名称:第十六届全国Web信息系统及其应用学术会议(WISA2019)  
会议时间:2019年9月20日
会议地点:青岛
主办单位:中国计算机学会
语种:chi
分类号:
关键词:分布式搜索引擎  文本相似度  TF-IDF算法  特征匹配
在线出版日期:2022年1月20日
基金项目:
相似文献
相关博文
2024-12-10 14:56 上传
文件大小:
1.26 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表