一种用于智能交互的语义模型方法技术

技术编号:12616184 阅读:109 留言:0更新日期:2015-12-30 13:38
本发明专利技术公开了一种用于智能交互的语义模型方法,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。本发明专利技术对用户指令的识别准确率高。

【技术实现步骤摘要】

本专利技术涉及一种智能交互方法,更具体的说是涉及。
技术介绍
在传统的智能交互中,智能交互的一般采用模板方式来应对复杂的对话,准确度较低,或者对信息进行各种分词后进行分析,但一般的分词结果种类多,准确度较低。
技术实现思路
本专利技术公开了,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。所述步骤A中的分词会基于特定领域的实例。所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。【具体实施方式】下面对本方法进行具体说明:A、对用户发出的信息进行分词;分词是计算机语言学或人工智能领域的常用技术手段,一般采用“最大匹配分词法”或“最大概率法分词”,B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;对于实体,是本体的实例化,所谓本体,是对概念的一种明确且详细的说明,是对现实世界的一种描述方法。或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达。一般包含:——具体的本体实例(对象Object)——本体的属性——所属的本体类别。本体实例化后,就可以继承本体的属性,为其后的语义标注分析做好准备;C、对步骤A所述分词后的字、词及词组进行语义标注分析;对于语义标注分析,包括词性标注和词义标注两个部分:对于词性标注:一般采用隐马尔科夫模型或者基于转换的错误驱动的磁性标注方法;对于词义标注:一般采用基于互信息的词义排歧方法或基于词典的排歧方法;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。本系统还会根据用户数据日志来调整权重。例如:“不”字基于统计学不重要,但经过统计分析,“不”字出现及句尾比例较高,其含义完全不同,所以当“不”字出现在句尾时,例如“我能开通彩铃不”调整“不”字权重。所述步骤A中的分词会基于特定领域的实例。具体来说,本专利的分词会基于特定领域,因为相同的汉字或词组在不同领域其分词所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。【主权项】1.,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。2.根据权利要求1所述的,其特征在于:所述步骤A中的分词会基于特定领域的实例。3.根据权利要求1所述的,其特征在于:所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。4.根据权利要求1所述的,其特征在于:所述步骤E中的句法分析根据重要度进行区分,区分方法包括开放领域和专业领域。【专利摘要】本专利技术公开了,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。本专利技术对用户指令的识别准确率高。【IPC分类】G06F17/27【公开号】CN105205045【申请号】CN201510603616【专利技术人】李波, 曾永梅, 姚贡之, 朱频频 【申请人】上海智臻智能网络科技股份有限公司【公开日】2015年12月30日【申请日】2015年9月21日本文档来自技高网...

【技术保护点】
一种用于智能交互的语义模型方法,包括以下步骤:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正。

【技术特征摘要】

【专利技术属性】
技术研发人员:李波曾永梅姚贡之朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1