文档名:基于成分共享的英汉小句对齐语料库标注体系研究
英汉小句对齐语料库服务于英语和汉语小句的语法结构对应关系研究和应用,对于语言理论和语言翻译(包括人的翻译和机器翻译)有重要意义.前人的语法理论和相关语料库的工作对于小句复合体和小句的界定缺乏充分研究,在理论上有缺陷,难以支持自然语言处理的应用.本文首先为英汉小句对齐语料库的建设做理论准备.从近年提出的汉语小句复合体的理论出发,本文界定了成分共享的概念,基于话头共享和引语共享来界定英语的小句和小句复合体,使小句和小句复合体具有功能的完整性和单一性.在此基础上,本文设计了英汉小句对齐的标注体系,包括英语NT小句标注和汉语译文生成及组合.语料库的标注表明,在小句复合体层面上英汉翻译涉及到的结构变换,其部件可以限制为英语小句和话头、话体,无需涉及话头和话体内部的结构.基于这些工作的英汉小句对齐语料库为语言本体研究和英汉语言对比、英汉机器翻译等应用提供了结构化的标注样本.
作者:葛诗利 宋柔
作者单位:广东外语外贸大学外语研究与语言服务协同创新中心,广东省广州市510420广东外语外贸大学外语研究与语言服务协同创新中心,广东省广州市510420;北京语言大学信息科学学院,北京市100083
母体文献:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会论文集
会议名称:第十八届中国计算语言学大会暨中国中文信息学会2019学术年会
会议时间:2019年10月18日
会议地点:昆明
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:英语 汉语 小句对齐语料库 成分共享 话头共享 标注体系
在线出版日期:2021年8月24日
基金项目:
相似文献
相关博文
- 文件大小:
- 634.42 KB
- 下载次数:
- 60
-
高速下载
|
|