System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及软件开发,尤其涉及一种人工智能的数据建模方法、装置、介质和设备。
技术介绍
1、现有的数据建模过程中,需要用户根据模型主题逐个补充完善模型属性,包括属性名称(表字段)和属性类型。对于同一个行业的不同项目,数据模型存在相似性和重复性,用户需要在不同的项目之间重复建模,即重复输入模型的各个属性,极大地增加了开发人员的工作量,数据建模效率较低。
技术实现思路
1、有鉴于此,本专利技术实施例的目的在于提供一种人工智能的数据建模方法、装置、介质和设备,以减少模型开发人员的工作量,提高建模效率。
2、为达到上述目的,第一方面,本专利技术提供一种人工智能的数据建模方法,所述方法包括:
3、获取用户输入的目标模型属性的名称,根据所述目标模型属性的名称从历史模型库中筛选出与所述目标模型属性相关的历史模型属性信息列表,所述历史模型属性信息包括字段名称、字段代码和数据类型;
4、提取所述历史模型属性信息列表中的字段名称的单词字典;
5、按照所述单词字典将所述历史模型属性信息列表中的每个历史模型属性的字段名称转换为第一向量,将所述目标模型属性的名称转换为第二向量;
6、使用余弦相似度算法计算所述第二向量与所述第一向量之间的相似度值,输出相似度值大于预设的相似度阈值的第一向量对应的字段名称;
7、按照输出的所述字段名称自动生成所述目标模型属性的名称对应的模型。
8、在一些可能的实施方式中,所述的提取所述历史模型
9、将所述历史模型属性信息列表中的字段名称合并为一个中文文档;
10、提取所述中文文档中出现的所有单词,按照所述单词出现的先后顺序标注每个所述单词的索引;
11、根据所述单词和所述单词对应的所述索引生成所述单词字典。
12、在一些可能的实施方式中,所述单词字典中还包括未登录词,所述未登录词是指所述目标模型属性的名称中未出现的词;
13、所述未登录词位于所述单词字典中末尾,按照所述单词的索引标注所述未登录词的索引。
14、在一些可能的实施方式中,所述的按照所述单词字典将所述历史模型属性信息列表中的每个模型属性的字段名称转换为第一向量,将所述目标模型属性的名称转换为第二向量,具体包括:
15、计算所述单词字典中每个单词和所述未登录词的词频,其中,每个所述单词的词频为所述单词在所述中文文档中出现的次数与所述中文文档的总字数的比值,所述未登录词的词频记为0;
16、按照单词字典的索引和词频将所述字段名称转换为n维的第一向量;
17、按照单词字典的索引和词频将所述目标模型属性的名称转换为n维的第二向量;其中,n为单词字典的单词数加1。
18、在一些可能的实施方式中,所述余弦相似度算法的计算公式如下:
19、;
20、其中,similarity为第二向量与每个第一向量之间的相似度值;a为第二向量,b为第一向量,||a||为第二向量的模长,||b||为第一向量的模长,i表示第一向量和第二向量的维度,ai表示第二向量的第i个维度值,bi表示第一向量的第i个维度值。
21、在一些可能的实施方式中,所述的按照输出的所述字段名称自动生成所述目标模型属性的名称对应的模型,具体包括:
22、根据输出的所述字段名称调取与所述字段名称对应的字段代码和数据类型;
23、按照所述相似度值的大小对所述字段名称进行排序后自动生成所述目标模型属性的名称对应的模型。
24、在一些可能的实施方式中,在所述获取用户输入的目标模型属性的名称,根据所述目标模型属性的名称从历史模型库中筛选出与所述目标模型属性相关的历史模型属性信息列表历史模型属性信息列表之前,还包括:
25、建立历史模型库;
26、将所述历史模型库中的每条模型属性信息以tab键进行分割,将所述历史模型属性信息划分为字段名称、字段代码和数据类型三个属性,并以文本的形式存储在本地磁盘中。
27、第二方面,本专利技术实施例提供了一种人工智能的数据建模装置,所述装置包括:
28、获取与筛选模块,用于获取用户输入的目标模型属性的名称,根据所述目标模型属性的名称从历史模型库中筛选出与所述目标模型属性相关的历史模型属性信息列表,所述历史模型属性信息包括字段名称、字段代码和数据类型;
29、提取模块,用于提取所述历史模型属性信息列表中的字段名称的单词字典;
30、转换模块,用于按照所述单词字典将所述历史模型属性信息列表中的每个历史模型属性的字段名称转换为第一向量,将所述目标模型属性的名称转换为第二向量;
31、计算并输出模块,用于使用余弦相似度算法计算所述第二向量与所述第一向量之间的相似度值,输出相似度值大于预设的相似度阈值的第一向量对应的字段名称;
32、自动生成模块,用于按照输出的所述字段名称自动生成所述目标模型属性的名称对应的模型。
33、第三方面,本专利技术实施例提供了一种电子设备,包括:
34、一个或多个处理器;
35、存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面任意一种所述的方法。
36、第四方面,本专利技术实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任意一种所述的方法。
37、上述技术方案具有如下有益效果:
38、本专利技术提供了一种人工智能的数据建模方法、装置、介质和设备,该方法包括:获取用户输入的目标模型属性的名称,根据目标模型属性的名称从历史模型库中筛选出与目标模型属性相关的历史模型属性信息列表,模型属性信息包括字段名称、字段代码和数据类型;提取历史模型属性信息列表中的字段名称的单词字典;按照单词字典将历史模型属性信息列表中的每个模型属性的字段名称转换为第一向量,将目标模型属性的名称转换为第二向量;使用余弦相似度算法计算第二向量与第一向量之间的相似度值,输出相似度值大于预设的相似度阈值的第一向量对应的字段名称;按照输出的字段名称自动生成目标模型属性的名称对应的模型。本专利技术实施例通过智能推荐方法,从历史模型库中自动提取出相似的模型属性列表,使用推荐的模型属性自动生成新模型,减少模型开发人员的工作量,提高建模效率,降低建模门槛,可以一键生成模型,避免重复劳动。
本文档来自技高网...【技术保护点】
1.一种人工智能的数据建模方法,其特征在于,所述方法包括:
2.根据权利要求1所述的数据建模方法,其特征在于,所述的提取所述历史模型属性信息列表中的字段名称的单词字典,具体包括:
3.根据权利要求2所述的数据建模方法,其特征在于,所述单词字典中还包括未登录词,所述未登录词是指所述目标模型属性的名称中未出现的词;
4.根据权利要求3所述的数据建模方法,其特征在于,所述的按照所述单词字典将所述历史模型属性信息列表中的每个历史模型属性的字段名称转换为第一向量,将所述目标模型属性的名称转换为第二向量,具体包括:
5.根据权利要求1所述的数据建模方法,其特征在于,所述余弦相似度算法的计算公式如下:;
6.根据权利要求1所述的数据建模方法,其特征在于,所述的按照输出的所述字段名称自动生成所述目标模型属性的名称对应的模型,具体包括:
7.根据权利要求2所述的数据建模方法,其特征在于,在获取用户输入的目标模型属性的名称,根据所述目标模型属性的名称从历史模型库中筛选出与所述目标模型属性相关的历史模型属性信息列表之前,还包括:<
...【技术特征摘要】
1.一种人工智能的数据建模方法,其特征在于,所述方法包括:
2.根据权利要求1所述的数据建模方法,其特征在于,所述的提取所述历史模型属性信息列表中的字段名称的单词字典,具体包括:
3.根据权利要求2所述的数据建模方法,其特征在于,所述单词字典中还包括未登录词,所述未登录词是指所述目标模型属性的名称中未出现的词;
4.根据权利要求3所述的数据建模方法,其特征在于,所述的按照所述单词字典将所述历史模型属性信息列表中的每个历史模型属性的字段名称转换为第一向量,将所述目标模型属性的名称转换为第二向量,具体包括:
5.根据权利要求1所述的数据建模方法,其特征在于,所述余弦相似度算...
【专利技术属性】
技术研发人员:王建林,肖姝,贾永强,全爱巧,
申请(专利权)人:北京宇信科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。