本发明专利技术提供了一种具有物料清单标准化方法、装置及计算机可读存储介质。所述方法包括:单元格抽取步骤:遍历物料清单的全部单元格,抽取各个单元格中的实体,并确定每个实体对应于多个实体类别的实体评分;表格列评分步骤:根据从每个表格列的单元格中抽取的实体的实体评分,计算每个表格列对应于多个实体类别的表格列评分;单元格评分步骤:根据单元格所在的表格列的表格列评分,修改该单元格内各实体对应于多个实体类别的实体评分;表格行排序步骤:根据每个表格行中各个实体类别的实体评分的排序结果,确定该表格行与该实体类别对应的实体结果;表格行汇总步骤:将物料清单中的所有表格行的实体结果进行汇总,生成标准化的物料清单。料清单。料清单。
【技术实现步骤摘要】
物料清单标准化方法、装置及计算机可读存储介质
[0001]本专利技术涉及互联网
,具体为一种具有物料清单标准化方法、物料清单标准化装置及计算机可读存储介质。
技术介绍
[0002]在工业生产领域,MRO是英文Maintenance,Repair,Operations三个单词的缩写,通常指非生产原料性质的工业用品,包括工厂或企业对其生产和工作的设施设备进行保养和维修的备品备件、以及维持正常运行的工具耗材等。相比于常规的生产原料等,MRO具有涉及范围广、品类繁杂、型号和规格众多、采购需求分散、部分可替代性等特点。尤其是品类和型号的繁杂,并且暂时没有大众向认可的统一标准,各方对同一种MRO的描述方式不尽相同使得需求方和供给方在商品的选型和采购过程中产生了大量隐性成本。
[0003]BOM(Bill of Material,物料清单),指一个项目或产品所需要的所有零部件/材料的清单。在MRO的选型和采购过程中,物料清单通常是由设计、采购或现场作业人员根据实际需求罗列的商品清单,并且包含品名、品牌、型号、物料号、规格、数量、价格等信息。需求方提供物料清单后,供给方根据相关信息对商品进行多轮选型和报价,最终完成订购。但是在实际操作中,由于各个需求方和供给方MRO的描述方式和物料清单的组织格式等均无法统一,供给方需要人工从各个需求方提供的不同种类不同形式的物料清单中抽取所需的品名、品牌、型号、物料号、规格、数量、价格等命名实体,手动整理成符合供给方预设的标准化的物料清单,才能进一步选型和报价。上述问题制约了物料清单选型和报价的效率和自动化,还会消耗大量人力物力,是本领域技术人员需要重点关注的。
[0004]因此,亟待一种技术方案,能够不受MRO的描述方式和物料清单的组织格式等形式上的限制,智能地将物料清单标准化,提高物料清单整理和选型的效率。
技术实现思路
[0005]针对以上问题,本专利技术提供了一种物料清单标准化方法,能够智能地根据原始物料清单表格,生成内容清晰准确、格式标准统一的物料清单,在提高物料清单选型和报价的效率同时,还能够节省大量的人工成本。
[0006]本专利技术提供的一种物料清单标准化方法,包括:
[0007]单元格抽取步骤:遍历物料清单的全部单元格,抽取各个单元格中的实体,并确定每个实体对应于多个实体类别的实体评分;
[0008]表格列评分步骤:根据从每个表格列的单元格中抽取的实体的实体评分,计算每个表格列对应于多个实体类别的表格列评分;
[0009]单元格评分步骤:根据单元格所在的表格列的表格列评分,修改该单元格内各实体对应于多个实体类别的实体评分;
[0010]表格行排序步骤:根据每个表格行中各个实体类别的实体评分的排序结果,确定该表格行与该实体类别对应的实体结果;
[0011]表格行汇总步骤:将物料清单中的所有表格行的实体结果进行汇总,生成标准化的物料清单。
[0012]通过上述的步骤,本专利技术的技术方案中提供的物料清单标准化方法,首先将物料清单中的实体抽出,将物料清单中物料的判别具体到每一个实体上,确定每个实体对应于多个实体类别的实体评分;因为每个表格列中的全部单元格对应的实体类别大概率是相同的,根据表格列的对应于多个实体类别的评分进行评分修正,能够使得评分更加客观准确,作为判断实体的标准也更加可靠;然后又因为物料清单中每一表格行均为一种具体的物料,根据评分排序得到每一表格行分别与各个实体类别对应的实体结果以得出具体物料;最后,将得到的物料按照指定的形式进行汇总,得到标准化的物料清单。从而,无论原始的物料清单为何种形式包括何种内容,本专利技术提供的方法均能够智能便捷地将其他形式种类清单转化为用户所需的形式即标准化的物料清单,大大方便了物料资料的整理、选型和报价等工作,并且节省了相应的人力资源。
[0013]具体而言,在本专利技术的较优技术方案中,物料清单标准化方法的单元格抽取步骤,实体基于实体词典的实体查询或者基于分类模型的实体预测抽取得到。物料清单标准化方法基于分辨出的实体判断物料,而实体词典中能够囊括用户预先定义的全部词汇以及相应的实体类别和评分以供与物料清单中得到的实体对照;而基于分类模型的实体预测能够进一步地囊括算法计算出的相应形式的实体,以保证准确地分别出各种实体,提高整体物料清单标准化方法计算的准确性。
[0014]优选地,本专利技术的技术方案中提供的物料清单标准化方法,还包括词典生成步骤,基于对商品知识图谱、商品详情页面或者网站搜索日志的离线挖掘,构建实体词典。
[0015]上述步骤基于物料的交易、应用、查询等各种层面的实际应用,来挖掘实体词汇并构建实体词典,能够尽可能地囊括行业中各方各面对物料的表达和描述方式,使得实体词典的囊括范围尽可能地全面和深入,避免误判或漏判实体,确保无论用户使用何种形式描述介绍物料,该物料均能被准确识别。
[0016]具体地,在本专利技术的较优技术方案中,物料清单标准化方法采用的实体词典中的实体为品名、品牌、型号、物料号、规格、数量、价格中的一种或多种,每个实体对应记录有词性、热度、逆文档频率、实体类别中的一种或多种项目。判别具体物料及物料的报价的依据主要依靠上述的品名、品牌、型号、物料号、规格、数量、价格等元素,因此在实体抽取中就需要准确的将上述元素分别的抓取出来,以供后续的计算判别。而每个实体关联记录的实体类别数据能够协助判断该实体为上述的哪一类实体,而词性、热度、逆文档频率等数据则是计算评分的依据。
[0017]优选地,本专利技术的技术方案中提供的物料清单标准化方法在表格列评分步骤中,在计算每个表格列对应于多个实体类别的表格列评分时,每个表格列中首行单元格的实体评分权重高于其他行单元格的实体评分权重。首行单元格通常为整个物料清单的表头,很可能会直接写出每一表格列的实体类别,如品名、品牌、型号、物料号、规格、数量、价格等,将首行单元格的实体评分权重设为最高能够有效地提高每个表格列对应于实体类别进行的实体评分判别计算的效率和准确率。
[0018]进一步地,本专利技术的技术方案中提供的物料清单标准化方法在单元格评分步骤中,以单元格所在的表格列的所述表格列评分乘以该单元格内各实体对应于实体类别的实
体评分的方式,修改各实体的实体评分。对每个单元格内的每个实体对应于实体类别进行的实体评分,由于是对单一实体词汇的判断有一定的偶然性。而每个表格列对应于实体类别进行的实体评分判别计算是基于整列数据综合计算的,较为权威准确,将二者相乘既能够在对每个实体进行独立判断的同时,减少偶然带来的误差,提高每个实体对应于实体类别进行的实体评分的准确性。
[0019]优选地,在本专利技术的技术方案中,上述的物料清单标准化方法生成的标准化的物料清单中还包括根据实体结果的实体评分计算得到的相似度数据。尤其在实体的评分没有达到阈值,无法准确地对应到具体的某种物料上时,相似度数据能够作为用户进行进一步分析筛选的重要依据。
[0020]优选地,本专利技术的技术方案中提供的物料清单标准化方法在表格行排序步骤中,若本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种物料清单标准化方法,其特征在于,包括:单元格抽取步骤:遍历物料清单的全部单元格,抽取各个单元格中的实体,并确定每个实体对应于多个实体类别的实体评分;表格列评分步骤:根据从每个表格列的单元格中抽取的实体的所述实体评分,计算每个表格列对应于多个实体类别的表格列评分;单元格评分步骤:根据单元格所在的表格列的所述表格列评分,修改该单元格内各实体对应于多个实体类别的实体评分;表格行排序步骤:根据每个表格行中各个实体类别的实体评分的排序结果,确定该表格行与该实体类别对应的实体结果;表格行汇总步骤:将所述物料清单中的所有表格行的所述实体结果进行汇总,生成标准化的物料清单。2.如权利要求1所述的物料清单标准化方法,其特征在于,在所述单元格抽取步骤中,所述实体基于实体词典的实体查询或者基于分类模型的实体预测抽取得到。3.如权利要求2所述的物料清单标准化方法,其特征在于,还包括:词典生成步骤,基于对商品知识图谱、商品详情页面或者网站搜索日志的离线挖掘,构建所述实体词典。4.如权利要求2所述的物料清单标准化方法,其特征在于,所述实体词典中的实体为品名、品牌、型号、物料号、规格、数量、价格中的一种或多种,每个实体对应记录有词性、热度、逆文档频率、实体类别中的一种或多种项目。5.如权利要求1所述的物料清单标准化方法,其特征在于,在所述表格列评分步骤中,在计算每个表格列对应于多个实体类别的表格列评分时,每个表格列中首行单元格的实体评分权重高于其他行单元格的实体评分权重。6.如权利要求1所述的物料清单标准化方法,其特征在于,在所述单元格评分步骤中,以单元格所在的表格列的所述表格列评分乘...
【专利技术属性】
技术研发人员:苏啸,何宇宸,胡叶岑,倪浩天,武靖文,
申请(专利权)人:米思米上海投资有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。