一种基于语义块的情感特征生成算法制造技术

技术编号：7272607 阅读：274 留言：0更新日期：2012-04-15 20:38

本发明专利技术涉及一种基于语义块的情感特征生成算法，属于中文文本情感分析领域。该发明专利技术的目的是提供一种新的情感特征生成算法。情感特征用语义块表示，语义块是独立的语义单位或语法单位，通过后缀树Suffix-tree(PAT?tree)结构查找，根据全部文本集合中上下文的统计结果，按策略选出最佳拆分结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术是一种基于语义块的情感特征生成算法，属于中文文本情感分析领域。
技术介绍
随着网络相关技术的高速发展，互联网已经逐步成为人们获取信息的重要来源和表达自己观点的平台，迅速增长的网上评论产生大量数据，于是针对特定需求，组织相关数据和获取有用信息，成为当前信息科学与
面临的一个重大的挑战。文本情感分类是指通过挖掘和分析文本中的观点、意见和看法等主观信息，对文本的情感倾向做出类别判断。它可广泛用于社会舆情分析、产品质量评价、影视评论等方面。一篇文本表现为一个由文字和标点组成的字符串。字或字符组成词，词组成短语，然后再形成句子、段落和篇章。因此对文本情感分析，研究者们一般都从判断词语的情感倾向性开始。CN101609459A号专利技术专利公告公布了一种情感特征词提取系统，该系统利用 tf (词语在文章中出现的次数)和df(词语出现在所评论集合的不同评论内容中的次数) 等参数的比值来选取一定数目得分较高的词作为广义情感特征词。然后根据语义关系图中词的同位词来建立狭义情感特征词表。由于该技术依赖于中文分词技术，这必然存在分词中的名词性主体识别、分词规范不统一等问题，直接影响情感特征的质量。本专利技术提出一种基于语义块的情感特征生成算法。语义块不一定是字、词、短语、句子等自然语言单位，它既可以看作语法单位也可是语义单位。通过使用语义块替代传统词典，能够更加准确的体现文本中的情感特征。
技术实现思路
本专利技术的目的是提供一种新的情感特征生成算法，情感特征用语义块表示，语义块是根据文本上下文的统计结果，按策略选出最佳拆分结果。本专利技术的技术方案如下通过...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：朱俭，
申请(专利权)人：朱俭，北京市通州区科学技术协会，北京千松科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人