现代汉语未登录词词类和语义类标注研究
作者:
邱立坤
ISBN:
9787030491800
出版日期:
2016-06
版次:
1
中图分类号:
H136,H146.2
学科分类:
丛书:
附注信息:
本书是语言学与计算机科学相结合的产物。作者不仅用语言学理论来指导计算机算法的设计,而且通过计算机算法的实验结果反过来验证并丰富语言学的理论。在大量统计、算法的基础上,提出与目前主流的分布词类观相反的论点,并用实验数据证明:在自动判断汉语新词语类别时词语内部结构特征比上下文分布特征更有效,进而提出内外结合原则,即判断新词语类别时应同时使用内部结构特征和外部上下文特征。基于这一原则,设计了相应的算法,实验结果表明这些算法要明显优于单独使用内部特征或者外部特征的算法。

    返回顶部