System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及物资数据处理,具体涉及一种供应链物资数据管理方法及系统。
技术介绍
1、企业现有供应商信息分散,难以全面了解,同时企业内部及外部存在多个供应商数据源,如erp、crm、供应商网站等,这些信息分散在不同的部门和系统中,难以统一管理和分析;同时供应商信息不仅包含结构化数据,还有大量的非结构化数据,如供应商网站上的文字介绍、产品介绍、评论反馈等,这些信息难以快速提取和洞察分析;在海量的供应商资源中,企业难以主动发现最适合自身需求的优质供应商,需要耗费大量人力进行手工筛选。
技术实现思路
1、针对上述现有技术存在的问题,本专利技术提供了一种供应链物资数据管理方法及系统,有效提高了供应链数据管理效率。该技术方案如下:
2、第一方面,提供了一种供应链物资数据管理方法,包括如下步骤:
3、接收供应链上下游企业的物资数据;
4、针对每个物资数据进行命名实体识别,识别出物资数据中的实体类型,所述实体类型包括物资主体的名称和物资主体的属性,所述属性包括属性类别和属性值,所述属性类别包括规格型号、材质、用途;
5、利用依存关系分析技术分析属性的语义依存关系,所述语义依存关系的类别包括:同义关系、上下位关系、部分整体关系、所属关系;
6、将不同实体映射到本体中对应的概念节点,建立实体与概念之间的关联,所述概念节点包括物资名称、属性、属性值;
7、利用构建好的物资本体,对实体进行语义标准化表示,将实体映射到本体中对应的概念
8、在一些实施方式中,所述针对每个物资数据进行命名实体识别,识别出物资数据中的实体类型,包括:
9、针对每个物资数据进行分词和词性标注;
10、使用依存句法分析技术,获取物资数据中的句法依存关系和语义依存关系,所述句法依存关系用于表征每个词语与谓词之间的关系,所述语义依存关系用于表征语义关联关系;
11、基于词性标注、句法依存关系、语义依存关系,获取物资数据中的实体类型。
12、在一些实施方式中,所述针对每个物资数据进行分词和词性标注,还包括:对分词结果进行候选分词结果分析,所述分析过程为:
13、获取当前分词结果记为第一分词结果;
14、获取分词结果中的当前词语,记为第一词语;
15、获取当前词位置的前后相邻位置的词,记为第二词语;
16、基于第二词语中至少一个靠近第一词语的字与第一词语中至少一个靠近第二词语的字,组成新的词语,记为第三词语;
17、在第三词语在词库中出现的频次大于0的情况下,将第三词语作为候选词;
18、基于第三词语作为候选词的情况,重新确定第三词语前和第三词语后的分词结果,记为第二分词结果。
19、在一些实施方式中,所述基于第二词语中至少一个靠近第一词语的字与第一词语中至少一个靠近第二词语的字,组成新的词语,记为第三词语,包括:
20、对于第一词语,在词库中搜索以第一词语首个字作为非首位的匹配词和以第一词语末尾字作为非末尾位的匹配词;在搜索到匹配词的情况下,将匹配的搜索词作为第三词语。
21、在一些实施方式中,所述针对每个物资数据进行分词和词性标注,还包括:对分词结果进行可信度分析,所述可信度分析包括如下步骤:
22、获取分词结果中的每个词语的语义特征;
23、基于分词结果中的当前词语的语义特征与相邻位置的第二词语的语义特征的梯度和分词结果中所有词语的语义适配性对分词结果进行可信度分析,其中,分词结果中的所有词语对应的梯度数据越大且所有词语的语义适配性越大,则分词结果的可信度越大。
24、在一些实施方式中,所述分词结果中所有词语的语义适配性,获取方法包括:
25、基于分词结果中的所有词语的词嵌入按顺序组成第一向量,
26、将分词结果中当前词语的词嵌入删除,并把其余词语的词嵌入按顺序组成第二向量;
27、将第一向量和第二向量输入语义对比分析模型,经过语义编码获得第一向量和第二向量语义相似性作为所述语义适配性。
28、在一些实施方式中,所述的一种供应链物资数据管理方法还包括:在形成标准物资属性特征库之后,对供应链上下游企业的物资数据进行关联匹配分析;
29、所述匹配分析,包括:
30、对于第一物资数据和第二物资数据,分别在标准物资属性特征库中进行匹配搜索,提取对应的关键属性;
31、对于第一物资数据和第二物资数据的每个属性,根据属性的数据类型确定对应的预设相似度计算方法,得到第一物资数据和第二物资数据的所述属性的相似度;
32、基于多个属性的所述相似度计算结果融合,确定第一物资数据和第二物资数据的相似度。
33、在一些实施方式中,所述对于第一物资数据和第二物资数据的每个属性,根据属性数据类型确定对应的预设相似度计算方法,包括:
34、对于文本类属性的相似度,基于编辑距离相似度作为第一相似度参数、jaccard相似度作为第二相似度参数,并经过对第一相似度参数、第二相似度参数分别赋值不同的权重,基于第一相似度参数、第二相似度参数加权融合得到所述文本类属性的综合相似度结果;
35、对于数值类属性,使用欧氏距离计算相似度;
36、对于类别属性,采用语义相似度计算方法。
37、在一些实施方式中,所述基于编辑距离相似度作为第一相似度参数、jaccard相似度作为第二相似度参数,并经过对第一相似度参数、第二相似度参数分别赋值不同的权重,所述权重的赋值方法,包括如下步骤:
38、以w1和w2分别表示编辑距离相似度和jaccard相似度的权重,且w1 + w2 = 1;
39、将已知的匹配对和不匹配对作为训练数据,使用监督学习算法学习w1和w2的最优值;以综合相似度与真实匹配情况之间的差异作为损失函数,通过优化算法不断调整w1和w2,直到损失函数最小化,确定最优值。
40、第二方面,提供了一种供应链物资数据管理系统,该系统包括:
41、数据获取单元,用于接收供应链上下游企业的物资数据;
42、实体识别单元,用于针对每个物资数据进行命名实体识别,识别出物资数据中的实体类型,所述实体类型包括物资主体的名称和物资主体的属性,所述属性包括属性类别和属性值,所述属性类别包括规格型号、材质、用途;
43、实体关系识别单元,用于利用依存关系分析技术分析属性的语义依存关系,所述语义依存关系的类别包括:同义关系、上下位关系、部分整体关系、所属关系;
44、标准物资属性特征库单元,用于将不同实体映射到本体中对应的概念节点,建立实体与概念之间的关联,所述概念节点包括物资名称、属性、属性值;利用构建好的物资本体,对实体进行语义标准化表示,将实体映射到本体中对应的概念本文档来自技高网...
【技术保护点】
1.一种供应链物资数据管理方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种供应链物资数据管理方法,其特征在于,所述针对每个物资数据进行命名实体识别,识别出物资数据中的实体类型,包括:
3.根据权利要求2所述的一种供应链物资数据管理方法,其特征在于,所述针对每个物资数据进行分词和词性标注,还包括:对分词结果进行候选分词结果分析,所述分析过程为:
4.根据权利要求3所述的一种供应链物资数据管理方法,其特征在于,所述基于第二词语中至少一个靠近第一词语的字与第一词语中至少一个靠近第二词语的字,组成新的词语,记为第三词语,包括:
5.根据权利要求2所述的一种供应链物资数据管理方法,其特征在于,所述针对每个物资数据进行分词和词性标注,还包括:对分词结果进行可信度分析,所述可信度分析包括如下步骤:
6.根据权利要求5所述的一种供应链物资数据管理方法,其特征在于,所述分词结果中所有词语的语义适配性,获取方法包括:
7.根据权利要求1所述的一种供应链物资数据管理方法,其特征在于,所述方法还包括:在形成标准物资属性
8.根据权利要求7所述的一种供应链物资数据管理方法,其特征在于,所述对于第一物资数据和第二物资数据的每个属性,根据属性数据类型确定对应的预设相似度计算方法,包括:
9.根据权利要求8所述的一种供应链物资数据管理方法,其特征在于,所述基于编辑距离相似度作为第一相似度参数、Jaccard相似度作为第二相似度参数,并经过对第一相似度参数、第二相似度参数分别赋值不同的权重,所述权重的赋值方法,包括如下步骤:
10.一种供应链物资数据管理系统,其特征在于,包括:
...【技术特征摘要】
1.一种供应链物资数据管理方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种供应链物资数据管理方法,其特征在于,所述针对每个物资数据进行命名实体识别,识别出物资数据中的实体类型,包括:
3.根据权利要求2所述的一种供应链物资数据管理方法,其特征在于,所述针对每个物资数据进行分词和词性标注,还包括:对分词结果进行候选分词结果分析,所述分析过程为:
4.根据权利要求3所述的一种供应链物资数据管理方法,其特征在于,所述基于第二词语中至少一个靠近第一词语的字与第一词语中至少一个靠近第二词语的字,组成新的词语,记为第三词语,包括:
5.根据权利要求2所述的一种供应链物资数据管理方法,其特征在于,所述针对每个物资数据进行分词和词性标注,还包括:对分词结果进行可信度分析,所述可信度分析包括如下步骤:
6.根...
【专利技术属性】
技术研发人员:封军,卢晓凯,周西,姚丽,
申请(专利权)人:安徽省优质采科技发展有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。