文档名:基于Hadoop的家庭宽带下手机号码识别研究
为了精确识别连接家宽的家庭成员手机号码,实现家宽业务与移动业务大数据的关联,本文提出了一种基于Hadoop分布式架构,采用DPI、正则匹配等技术的家庭宽带手机号码识别提取方法.该方法通过时间阈值调整、关键字提取,host排除等步骤,可以更准确地识别出宽带下用户手机号码.结果表明,识别出的用户运营商归属地分布与实际调研基本吻合,相比人工识别方法,识别效率提升明显.
作者:胡琳欣陈郁乔纪纯妹
作者单位:中国移动通信集团广东有限公司汕头分公司,广东汕头515000
母体文献:2018广东通信青年论坛论文集
会议名称:2018广东通信青年论坛
会议时间:2018年11月1日
会议地点:广州
主办单位:广东科协,广东省通信学会
语种:chi
分类号:TP3TS2
关键词:移动大数据 家庭宽带 手机号码识别 Hadoop分布式架构
在线出版日期:2021年12月15日
基金项目:
相似文献
相关博文
- 文件大小:
- 2.69 MB
- 下载次数:
- 60
-
高速下载
|
|