当前位置: 首页 > 专利查询>余自立专利>正文

自然表达处理方法、处理及回应方法、设备及系统技术方案

技术编号:13333833 阅读:69 留言:0更新日期:2016-07-12 04:24
本发明专利技术公开了一种自然表达处理方法,包括:对于来自用户的自然表达进行识别,得到计算机可处理的某种形式的语言信息;以及将识别得到的语言信息转换为编码形式的标准表达。根据本发明专利技术实施例的自然表达处理方法,可以将自然表达转换为编码化的标准表达,由于该标准表达的转换是将自然表达的语义转换为编码和参数,而无需精确的逐字翻译,因此可以降低机器翻译的精准度要求,同时降低用于实现表达转换(机器翻译)的数据库的复杂度,提高数据查询和更新速度,从而提高智能处理的性能。另一方面,相对简单的编码化表达,也可以减少人工辅助干预的工作量,提高人工辅助干预的工作效率。

【技术实现步骤摘要】
【国外来华专利技术】自然表达处理方法、处理及回应方法、设备及系统
本专利技术涉及一种信息处理方法,具体而言,涉及一种对于人类自然表达的处理方法,对于该自然表达的处理及回应方法以及应用该处理及回应方法的信息处理设备和信息处理系统。
技术介绍
机器翻译(MT,MachineTranslation,俗称“机翻”)属于计算语言学(ComputationalLinguistics)的范畴,其利用计算机程序将文字或语音表达从一种自然语言翻译成另一种自然语言。从某种意义上,实现了不同自然语言间的词汇替换。进一步,通过使用语料库技术,可实现更加复杂的自动翻译,更好地处理不同的文法结构、词汇辨识、惯用语的对应等。目前的机器翻译工具通常可允许针对特定领域或是专业(例如天气预报)来加以定制化,目的在于将词汇的翻译缩小于该特定领域的专有名词上,以改进翻译的结果。这种技术针对一些使用较正规或是较制式化陈述方式的领域来说特别有效。例如,政府机关或法律相关文件,通常比一般的文字表达更加正式与制式化,其机器翻译的结果往往比日常生活对话这种非正式文件要好。但是,机器翻译的结果好坏,往往取决于译入跟译出语之间,在词汇、文法结构、语系甚至文化上的差异,例如英文与荷兰文同为印欧语系日耳曼语族,这两种语言间的机器翻译结果,通常便会比中文与英文间机器对译的结果要好很多。因此,要改善机器翻译的结果,人为的介入仍显相当重要,例如,某些机器翻译的系统若能够由人为的界定或选择哪个词语比较适合,则可大幅改进机器翻译的正确度与品质。目前的一些翻译工具,例如AltaVistaBabelfish,有时可以得到可以理解的翻译结果,但是想要得到较有意义的翻译结果,往往需要在输入语句时进行适当地编辑,以利于计算机程序分析。一般而言,大众使用机器翻译的目的,可能只是为了要得知原文句子或段落的要旨,而不是精确的翻译。总的说来,机器翻译还没有达到可以取代专业(人工)翻译的程度,并且也尚不能成为正式的翻译。自然语言处理(NLP,NaturalLanguageProcessing)是人工智能和语言学领域的分支学科。在此领域中探讨如何处理及运用自然语言;自然语言认知则是指让计算机“懂”人类语言背后的实质涵义。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。理论上,NLP是一种很吸引人的人机交互方式。早期的语言处理系统,如SHRDLU,当它们处于一个有限的“积木世界”,运用有限的词汇表会话时,工作得相当好。这使得研究员们对此系统相当乐观。然而,当这个系统拓展到充满了现实世界的含糊与不确定性的环境中时,他们很快就丧失了信心。由于理解(Understanding)自然语言,需要关于外在世界的广泛知识以及运用操作这些知识的能力,自然语言认知,同时也被视为一个人工智能完备(AI-Complete)的问题。基于统计的自然语言处理运用了概率和统计的方法来解决基于文法规则的自然语言处理存在的问题。尤其是针对容易高度模糊的长串句子,当套用实际文法进行分析时可能会产生出成千上万种可能性。处理这些高度模糊句子所采用消歧的方法通常运用到语料库以及马可夫模型(Markovmodels)。统计自然语言处理的技术主要由人工智能技术中与学习行为相关的子领域——机器学习(MachineLearning)及数据挖据(DataMining)所演进而成。但是,这种基于统计的自然语言处理方法,需要建立含有庞大数据量的配对语料的语料库供计算机学习和使用,而对于数据量巨大的语料库而言,从中检索出对应的机器翻译(理解)结果并进行反馈,也需要很大的计算资源支持。此外,即使采用这种方法,应对实际自然语言的多样性及不确定性也有很大的困难。自然语言处理技术在实践中有着广泛的应用。例如,交互式语音应答和互联网呼叫中心系统等。交互式语音应答(IVR,InteractiveVoiceResponse)是一种基于电话的语音增值业务的统称。很多机构(如银行,信用卡中心,电信运营商等)都通过交互式语音应答系统(IVRS,InteractiveVoiceResponseSystem)向客户提供各式各样的自助服务,客户可拨打指定的电话号码,进入系统,根据系统之指示,键入适当的选项或个人资料,以听取预录之信息,或经计算机系统根据预设的程序(CallFlow)组合数据,以语音方式读出特定的资料(如户口结余、应付金额等),还可通过系统输入交易指示,以进行预设的交易(如转账、更改密码、更改联系电话号码等)。尽管IVR系统在过去十数年得到了广泛的应用,但在技术上,IVR系统天生就有一个至今仍困扰着所有机构的硬伤:无法简化的多层选项菜单树。用户在使用IVR系统选择自助服务的时候,绝大多数都没耐心去花时间游历一棵多层选项的菜单树,而是直接按“0”转人工客服座席,导致机构对IVR系统能“有效提升客户使用自助服务比率和大幅替代人工作业量”的期望与现实存在着一个不可逾越的鸿沟。互联网呼叫中心系统(ICCS,InternetCallCenterSystem)是近年兴起的一种新型呼叫中心系统,采用流行的即时通讯(IM,InstantMessaging)互联网技术,让机构与自己的客户可以在互联网上进行主要基于文本的实时沟通,被应用于机构的客户服务和远程销售。使用ICCS的人工座席可以同时与两个以上的客户进行交流。可以说,基于文本的ICC系统是基于语音的IVR系统的一个变种,都是机构与其客户之间进行沟通(不管是客户服务,还是远程销售)的必要工具,两者背后都需要人工座席的高度参与。因此,与IVR系统一样,ICC系统同样难以满足机构的“有效提升客户使用自助服务比率和大幅替代人工作业量”需求。另一方面,传统的语音识别技术基于缺乏准确度和稳定度的语音识别结果,利用关键字搜索技术,采用“穷举法”去做语音的语义分析。虽然很多语音识别技术公司在“转写(Transcription)”和“关键字切割(KeywordSpotting)”这两项工作上耗费了巨大的人力与金钱,并且长期坚持不懈地去训练语音机器人,但实际效果往往与理想中的效果相差甚远。
技术实现思路
根据本专利技术的一个方面,提供了一种自然表达处理方法,其包括:对于来自用户的自然表达进行识别,得到计算机可处理的某种形式的语言信息;以及将识别得到的语言信息转换为编码形式的标准表达。根据本专利技术实施例的自然表达处理方法,可选地,标准表达包括体现用户需求的需求代码。根据本专利技术实施例的自然表达处理方法,可选地,需求代码用数字编码表示。根据本专利技术实施例的自然表达处理方法,可选地,标准表达还包括进一步体现用户具体需求的需求参数。根据本专利技术实施例的自然表达处理方法,可选地,所述语言信息是由利用建模工具对语音形式的自然表达进行切割和转换得到的语言信息单元构成的。根据本专利技术实施例的自然表达处理方法,可选地,所述语言信息是由音素、字和短语中的一种构成的。根据本专利技术实施例的自然表达处理方法,可选地,基于语言信息与标准表达的MT(MachineTranslation机器翻译)训练数据表来实现从语言信息到标准表达的转换。根据本专利技术实施例的自然表达处理方法,可选地,在识别自然表达的同时得到与该自然表达相关的信息,并将此信息转换为本文档来自技高网
...

【技术保护点】
PCT国内申请,权利要求书已公开。

【技术特征摘要】
【国外来华专利技术】2013.10.28 CN 20131051634051.一种自然表达处理方法,其中,包括:接收自然表达的输入,对于所述自然表达进行识别,得到计算机可处理的某种形式的语言信息;以及将识别得到的语言信息转换为编码形式的标准表达,其中,将所述语言信息转换为所述标准表达包括:基于对一定时间区间内的机器人理解准确率的评估来判断机器人的理解能力是否成熟,当判断机器人的理解能力成熟,由机器人将所述语言信息转换为所述标准表达;当判断机器人的理解能力不成熟,通过人工转换处理将所述语言信息转换为所述标准表达,其中,通过基于所述语言信息与所述标准表达的MT训练数据表来实现从所述语言信息到所述标准表达的转换,该MT训练数据表包括:通过转换所述自然表达所得到的计算机可处理的语言信息,编码化的标准表达以及所述语言信息和所述标准表达的对应关系,其中,通过机器人自学习来提高机器人理解准确率,该机器人自学习包括:使得机器人对于MT训练数据表中已有的所述语言信息的元素的各种排列组合和所述标准表达的元素的各种排列组合进行循环迭代比较,找出所述语言信息元素的排列组合与所述标准表达元素的排列组合之间的对应关系。2.根据权利要求1所述的自然表达处理方法,其中,所述标准表达包括体现用户需求的需求代码。3.根据权利要求2所述的自然表达处理方法,其中,所述需求代码用数字编码表示。4.根据权利要求2所述的自然表达处理方法,其中,所述标准表达还包括进一步体现用户具体需求的需求参数。5.根据权利要求1-4中任意一项所述的自然表达处理方法,其中,所述语言信息是由利用建模工具对语音形式的所述自然表达进行切割和转换得到的语言信息单元构成的。6.根据权利要求1-4中任意一项所述的自然表达处理方法,其中,所述语言信息是由音素、字和短语中的一种构成的。7.根据权利要求1-4中任意一项所述的自然表达处理方法,其中,在识别所述自然表达的同时得到与该自然表达相关的信息,并将此信息转换为所述标准表达的一部分。8.根据权利要求1所述的自然表达处理方法,其中,所述MT训练数据表的数据可以从外部数据库导入,也可以通过人工辅助理解来进行生成和添加。9.一种自然表达处理及回应方法,其中,包括:通过根据权利要求1-8中任何一项的自然表达处理方法获得所述标准表达;调用或生成与所述机器转换或者人工转换的标准表达相匹配的标准回应;以与从自然表达识别的表达类型信息对应的方式输出所述调用或生成的标准回应。10.根据权利要求9所述的自然表达处理及回应方法,其中,所述标准回应是预先存储在数据库中的固定数据,或者基于变量参数和预先在数据库中存储的标准回应的基础数据来生成所述标准回应。11.一种自然表达处理及回应设备(1),其中,包括:对话网关(11),中央控制器(12),MAU工作站(13),机器人(14),表达数据库,回应数据库(113)和回应生成器(114),其中,对话网关(11)接收来自用户(8)的自然表达,发送给中央控制器(12)进行后续处理,并且将对所述自然表达的回应发送给用户(8);中央控制器(12)接收来自所述对话网关(11)的自然表达,并与机器人(14)以及MAU工作站(13)协同工作,将该自然表达转换为编码化的标准表达,并根据所述标准表达指示回应生成器(114)生成与该标准表达对应的标准回应;机器人(14)根据所述中央控制器(12)的指示,识别所述自然表达,得到计算机可处理的某种形式的语言信息,并且利用所述表达数据库将该语言信息转换为所述标准表达;MAU工作站(13)将经识别的自然表达或者所述来自用户(8)的自然表达呈现给外部的MAU人工座席(9),MAU人工座席(9)通过MAU工作站(13)输入或者选择标准表达,然后MAU工作站(13)将该标准表达发送给中央控制器(12);表达数据库用于存储表达相关数据,包括:与所述自然表达相关的所述语言...

【专利技术属性】
技术研发人员:余自立
申请(专利权)人:余自立
类型:发明
国别省市:上海;31

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1