【技术实现步骤摘要】
一种描述数据处理方法、系统、电子设备及介质
本专利技术涉及数据处理
,尤其涉及一种描述数据处理方法、系统、电子设备及介质。
技术介绍
由于每个人对于将要描述的事件的了解程度、专业程度以及描述方式的不同,可能不同人对于同样的事件会有各种各样的描述,有些人语速过慢、吐字不够清晰,造成聆听者理解难度进一步提升,将导致对描述信息接收及处理的速度缓慢,事务处理速度慢。相关技术中,往往单纯的将描述语音转化为描述文字,展示给相关工作人员,以提升相关工作人员的事务处理速度,但若描述文字长篇累牍,仍然需要相关工作人员耗时阅读,费时整理,工作效率不高,客户体验度不好。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术提供一种描述数据处理方法、系统、电子设备及介质,以解决相关技术中单纯的将描述语音转化为描述文字,仍然需要相关工作人员耗时阅读,费时整理,工作效率不高,客户体验度不好的技术问题。本专利技术提供的一种描述数据处理方法,包括:根据获取到的描述数据生成描述文本,并进行分句处理,得到若干句初始描述语句;获取各所述初始描述语句中的主语人称关键词,并确定目标主语人称关键词;对目标描述语句进行分词处理,得到若干个目标描述词,并从所述目标描述词中确定若干个事件关键词,所述目标描述语句为包括所述目标主语人称关键词的所述初始描述语句;若预设标准词库中存在与所述事件关键词相似度高于预设相似度阈值的标准关键词,将所述目标描述语句中的所述事件关键词替换为所述标准关键词; >根据包括所述标准关键词的所述目标描述语句生成若干个简化描述语句,并将所述简化描述语句和所述简化描述语句所对应的描述数据关联存储,完成所述描述数据的处理。可选的,所述根据包括所述标准关键词的所述目标描述语句生成若干个简化描述语句包括:获取具有相同所述标准关键词的各所述目标描述语句中的事件描述词,所述事件描述词包括除所述事件关键词外的所述目标描述词;将所述事件描述词与预设标准词库中的标准描述词进行相似度比对;若所述事件描述词与所述标准描述词的相似度高于第二预设相似度阈值,将所述事件描述词替换为所述标准描述词;根据所述标准关键词和标准描述词生成一个所述简化描述语句,每一个所述简化描述语句中包括一个所述标准关键词。可选的,所述目标主语人称关键词的确定方式包括以下任意之一:将所述主语人称关键词与预设人称关键词进行相似度比对,若所述主语人称关键词与预设人称关键词之间的相似度高于第一预设相似度阈值,将所述主语人称关键词作为目标主语人称关键词;将所述主语人称关键词中的清晰关键词进行同义替换处理,得到若干个标准主语人称关键词,对所述主语人称关键词中的模糊关键词进行消岐处理,将所述模糊关键词替换为所述标准主语人称关键词,确定各所述标准主语人称关键词的词占比,将所述词占比最高的所述标准主语人称关键词作为目标主语人称关键词。可选的,所述描述数据的生成方式包括:获取音频数据,所述音频数据包括言语信息和用户情感标识信息,所述用户情感标识信息包括语调、停顿、音量、语速中至少之一;根据所述用户情感信息确定所述用户情感,并根据所述用户情感和所述言语信息生成所述描述数据。可选的,所述描述数据的生成方式包括:获取视频数据,所述视频数据包括言语信息和用户情感标识信息,所述用户情感标识信息包括语调、停顿、音量、语速、面部表情、讲述姿势中至少之一;根据所述用户情感信息确定所述用户情感,并根据所述用户情感和所述言语信息生成所述描述数据。可选的,所述方法还包括:获取简化描述语句中各所述目标描述词的词义态度,所述词义态度包括积极、消极和中性;根据所述简化描述语句中各所述词义态度的目标描述词的占比确定所述简化描述语句的语句情感信息;将所述语句情感信息、所述简化描述语句和所述简化描述语句所对应的描述数据关联存储。可选的,所述方法还包括:显示各所述简化描述语句;选中所述简化描述语句,展示所述简化描述语句的语句情感信息、所对应的描述数据以及所述描述数据的用户情感。本专利技术还提供了一种描述数据处理系统,包括:分句模块,用于根据获取到的描述数据生成描述文本,并进行分句处理,得到若干句初始描述语句;确定模块,用于获取各所述初始描述语句中的主语人称关键词,并确定目标主语人称关键词;分词模块,用于对目标描述语句进行分词处理,得到若干个目标描述词,并从所述目标描述词中确定若干个事件关键词,所述目标描述语句为包括所述目标主语人称关键词的所述初始描述语句;替换模块,用于若预设标准词库中存在与所述事件关键词相似度高于预设相似度阈值的标准关键词,将所述目标描述语句中的所述事件关键词替换为所述标准关键词;生成模块,用于根据包括所述标准关键词的所述目标描述语句生成若干个简化描述语句,并将所述简化描述语句和所述简化描述语句所对应的描述数据关联存储,完成所述描述数据的处理。本专利技术还提供了一种电子设备,包括处理器、存储器和通信总线;所述通信总线用于将所述处理器和存储器连接;所述处理器用于执行所述存储器中存储的计算机程序,以实现如上述任一项实施例所述的方法。本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于使所述计算机执行如上述任一项实施例所述的方法。本专利技术的有益效果:本专利技术中的一种描述数据处理方法、系统、电子设备及介质,该方法通过根据获取到的描述数据生成描述文本,并进行分句处理,得到若干句初始描述语句,获取各初始描述语句中的主语人称关键词,并确定目标主语人称关键词,对目标描述语句进行分词处理,得到若干个目标描述词,并从目标描述词中确定若干个事件关键词,若预设标准词库中存在与事件关键词相似度高于预设相似度阈值的标准关键词,将目标描述语句中的事件关键词替换为标准关键词,根据包括标准关键词的目标描述语句生成若干个简化描述语句,并将简化描述语句和简化描述语句所对应的描述数据关联存储,完成描述数据的处理,可以提升语音数据的整理效率,节省时间,提升客户体验度。附图说明图1是本专利技术实施例中描述数据处理方法的一种流程示意图。图2是本专利技术实施例中描述数据处理系统的一种结构示意图。图3是本专利技术一实施例中电子设备的一种结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺本文档来自技高网...
【技术保护点】
1.一种描述数据处理方法,其特征在于,包括:/n根据获取到的描述数据生成描述文本,并进行分句处理,得到若干句初始描述语句;/n获取各所述初始描述语句中的主语人称关键词,并确定目标主语人称关键词;/n对目标描述语句进行分词处理,得到若干个目标描述词,并从所述目标描述词中确定若干个事件关键词,所述目标描述语句为包括所述目标主语人称关键词的所述初始描述语句;/n若预设标准词库中存在与所述事件关键词相似度高于预设相似度阈值的标准关键词,将所述目标描述语句中的所述事件关键词替换为所述标准关键词;/n根据包括所述标准关键词的所述目标描述语句生成若干个简化描述语句,并将所述简化描述语句和所述简化描述语句所对应的描述数据关联存储,完成所述描述数据的处理。/n
【技术特征摘要】
1.一种描述数据处理方法,其特征在于,包括:
根据获取到的描述数据生成描述文本,并进行分句处理,得到若干句初始描述语句;
获取各所述初始描述语句中的主语人称关键词,并确定目标主语人称关键词;
对目标描述语句进行分词处理,得到若干个目标描述词,并从所述目标描述词中确定若干个事件关键词,所述目标描述语句为包括所述目标主语人称关键词的所述初始描述语句;
若预设标准词库中存在与所述事件关键词相似度高于预设相似度阈值的标准关键词,将所述目标描述语句中的所述事件关键词替换为所述标准关键词;
根据包括所述标准关键词的所述目标描述语句生成若干个简化描述语句,并将所述简化描述语句和所述简化描述语句所对应的描述数据关联存储,完成所述描述数据的处理。
2.如权利要求1所述的描述数据处理方法,其特征在于,所述根据包括所述标准关键词的所述目标描述语句生成若干个简化描述语句包括:
获取具有相同所述标准关键词的各所述目标描述语句中的事件描述词,所述事件描述词包括除所述事件关键词外的所述目标描述词;
将所述事件描述词与预设标准词库中的标准描述词进行相似度比对;
若所述事件描述词与所述标准描述词的相似度高于第二预设相似度阈值,将所述事件描述词替换为所述标准描述词;
根据所述标准关键词和标准描述词生成一个所述简化描述语句,每一个所述简化描述语句中包括一个所述标准关键词。
3.如权利要求1所述的描述数据处理方法,其特征在于,所述目标主语人称关键词的确定方式包括以下任意之一:
将所述主语人称关键词与预设人称关键词进行相似度比对,若所述主语人称关键词与预设人称关键词之间的相似度高于第一预设相似度阈值,将所述主语人称关键词作为目标主语人称关键词;
将所述主语人称关键词中的清晰关键词进行同义替换处理,得到若干个标准主语人称关键词,对所述主语人称关键词中的模糊关键词进行消岐处理,将所述模糊关键词替换为所述标准主语人称关键词,确定各所述标准主语人称关键词的词占比,将所述词占比最高的所述标准主语人称关键词作为目标主语人称关键词。
4.如权利要求1所述的描述数据处理方法,其特征在于,所述描述数据的生成方式包括:
获取音频数据,所述音频数据包括言语信息和用户情感标识信息,所述用户情感标识信息包括语调、停顿、音量、语速中至少之一;
根据所述用户情感信息确定所述用户情感,并根据所述用户情感和所述言语信息...
【专利技术属性】
技术研发人员:姚娟娟,
申请(专利权)人:明品云北京数据科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。