System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及但不局限于信息,尤其涉及一种数据处理方法、装置以及计算机程序产品。
技术介绍
1、数据查询是指基于用户输入的查询语句,对数据库中的数据进行查询和分析,进而得到查询结果。例如,可以基于查询语句从预先构建的知识库中查询答案,并将查询得到的答案反馈给用户。
2、但是,相关技术中预先构建的知识库中的数据比较单一,且不全面,导致查询得到的结果不准确。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种数据处理方法、装置以及计算机程序产品,能够丰富目标语料库中的数据量,增加目标语料库中数据的全面性,在对目标语料库进行数据查询时,能够提高查询结果的准确性。
2、根据本公开实施例的第一方面,提供一种数据处理方法,包括:
3、获取文本单元,对所述文本单元进行向量转换,得到所述文本单元的文本向量;
4、基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库;
5、根据所述目标数据库,构建目标语料库。
6、根据本公开实施例的第二方面,提供一种数据处理装置,包括:
7、转换模块,被配置为获取文本单元,对所述文本单元进行向量转换,得到所述文本单元的文本向量;
8、第一构建模块,被配置为基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库;
9、第二构建模块,被配置为根据所述目标数据库,构建目标语料库。
10、根据本公开实施例的第三方
11、处理器;
12、用于存储计算机程序或指令的存储器;
13、其中,所述处理器执行所述计算机程序或指令,以实现上述第一方面中任一项所述的方法的步骤。
14、根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,所述存储介质存储有计算机程序或指令,当所述存储介质中的计算机程序或指令由处理器执行时,实现上述第一方面中任一项所述的方法的步骤。
15、根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序或者指令,所述计算机程序或指令被处理器执行时,实现上述第一方面中任一项所述的方法的步骤。
16、本公开的实施例提供的技术方案可以包括以下有益效果:
17、本公开的实施例提供的技术方案,可以确定各个文本单元之间的关联关系,得到关联关系集,对文本单元进行向量转换,得到文本单元的文本向量,基于文本单元、文本向量以及文本单元的关联关系集构建目标数据库;根据目标数据库,构建目标语料库。
18、基于文本单元、文本向量以及文本单元之间的关联关系集构建目标语料库,从多个维度利用文本单元,能够丰富目标语料库中的数据量,增加目标语料库中数据的全面性,在对目标语料库进行数据查询时,能够提高查询结果的准确性。
19、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
本文档来自技高网...【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本单元的标识和所述关联关系集,构建关系数据库,包括:
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一查询语句、所述第一查询结果以及所述参考结果,确定所述目标语料库的目标评估值,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一查询结果中第一目标结果的数量和所述第一查询结果的数量,确定第一评估值,包括:
7.根据权利要求5所述的方法,其特征在于,所述基于所述第一目标结果的数量和所述参考结果的数量,确定第二评估值,包括:
8.根据权利要求2所述的方法,其特征在于,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述基于所述第二查询结果和第三查询结果,从所述关系数据库中确
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
11.一种数据处理装置,其特征在于,包括:
12.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时,实现权利要求1至10中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本单元、所述文本向量以及所述文本单元的关联关系集构建目标数据库,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述文本单元的标识和所述关联关系集,构建关系数据库,包括:
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一查询语句、所述第一查询结果以及所述参考结果,确定所述目标语料库的目标评估值,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一查询结果中第一目标结果的数量和所述第一查询结果的数量...
【专利技术属性】
技术研发人员:王忠新,王衡阳,李阳,罗雄清,徐奕成,刘长波,
申请(专利权)人:珠海金山办公软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。