文档名:基于答案辅助的半监督问题分类方法
问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务.本文提出了一种基于答案辅助的半监督问题分类方法.首先,将答案特征结合问题特征一起实现样本表示;然后,利用标签传播方法对已标注问题训练分类器,自动标注未标注问题的类别;最后,将初始标注的问题和自动标注的问题合并作为训练样本,利用最大熵模型对问题的测试文本进行分类.实验结果表明,本文提出的基于答案辅助的半监督分类方法能够充分利用未标注样本提升性能,明显优于其他的基准方法.
作者:张栋李寿山周国栋
作者单位:苏州大学自然语言处理实验室苏州215006
母体文献:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)论文集
会议名称:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
会议时间:2015年11月13日
会议地点:广州
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:问答系统 半监督分类方法 答案辅助 标签传播方法 最大熵模型
在线出版日期:2018年3月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 452.53 KB
- 下载次数:
- 60
-
高速下载
|
|