统计语言建模与中文文本自动校对技术
作者:
张仰森
ISBN:
9787030518552
出版日期:
2017-03
版次:
1
中图分类号:
H087,TP391.12
学科分类:
丛书:
附注信息:
本书是作者多年来在自然语言处理领域开展对统计语言建模以及中文文本校对技术研究的总结。主要内容包括统计语言建模和中文文本自动校对技术两部分内容,共12 章。第一部分介绍统计语言模型构建的基本原理与方法,并对模型训练及评价方法进行研究,提出统计语言模型建模时训练语料规模的定量化度量方法。第二部分概述中文文本中常见的各种错误,并针对这些错误类型提出字词级、句法级和语义级错误的自动侦测方法与模型,开创了汉语文本语义错误自动侦测的新思路,提出中文文本错误的纠错建议生成与排序模型。最后基于所提出的模型与算法开发“正文通”中文文本校对系统。

    返回顶部