廖志芳1,周国恩1,李俊锋2,刘 飞1,蔡 飞1.中文短文本语法语义相似度算法[J].湖南大学学报:自然科学版,2016,43(2):135~140
中文短文本语法语义相似度算法
A Chinese Short Text Similarity Algorithm Based on Semantic and Syntax
  
DOI:
中文关键词:  语法语义相似度  语句相似性计算  HowNet  语料库  语法分析  语义分析  相似度计算
英文关键词:semantic and syntax similarity  sentence similarity calculating  HowNet  corpus  semantic analysis  syntax analysis  similarity measure
基金项目:
作者单位
廖志芳1,周国恩1,李俊锋2,刘 飞1,蔡 飞1 (1.中南大学 软件学院, 湖南 长沙 410075 2.中南大学 信息科学与工程学院, 湖南 长沙 410075) 
摘要点击次数: 1162
全文下载次数: 4226
中文摘要:
      通过分析中文短文本的特征,提出了一种基于语法语义的短文本相似度算法.该算法结合中文语句语义的相似性以及语句语法的相似性,即计算具有相同句法结构的短文本的相似度以及考虑语句词组顺序对相似度的贡献,对中文短文本相似度进行计算.实验表明,本文提出的算法在中文短文本相似度计算结果上更加接近人们的主观判断并且拥有比较好的精确率与召回率.
英文摘要:
      A short text algorithm based on semantic and syntax by analyzing the characteristics of Chinese short text was proposed.The algorithm combines semantic similarity with the similarity of sentence syntax in Chinese short text, that is to say, to calculate the similarity of short text with the same syntax structure and consider the contribution with sentence words order to similarity.The experiments show that the proposed algorithm is closer to people's judgment and gets a better precision rate and recall rate in the aspect of Chinese short text similarity calculation results.
查看全文  查看/发表评论  下载PDF阅读器
关闭