智能SKU匹配方法组成比例

技术编号:16237846 阅读:42 留言:0更新日期:2017-09-21 19:14
本发明专利技术公开了一种智能SKU匹配方法,包括步骤:输入客户SKU数据并存储于一数据库单元,客户SKU数据包括一或复数个客户商品名称数据;输入电商SKU数据并存储于数据库单元,电商SKU数据包括复数个电商商品名称数据以及和电商商品相关数据;提取每一客户商品名称数据的关键词序列并根据关键词序列生成所述客户SKU数据的评分索引;去除每一电商商品名称数据的干扰数据并形成商品索引;将每一客户商品名称数据与所述商品索引进行匹配,并利用所述评分索引寻找到与每一所述客户商品名称数据对应的匹配度最高的电商商品名称数据和电商商品相关数据。由于采用了本发明专利技术的一种智能SKU匹配方法,具有智能型强、匹配精确度高的优点。

Intelligent SKU matching method

The invention discloses a SKU intelligent matching method, which comprises the following steps: inputting customer SKU data and stored in a database unit, the customer SKU data includes a plurality of customers or commodity data; input data stored in the database and the SKU business unit, including a plurality of data providers SKU business data and related commodity name and commodity electricity supplier keywords data extraction; sequences of each customer name of commodity data according to the score index keyword sequence generating the SKU customer data; remove the interference data of each electricity supplier commodity data and form commodity index; to match each customer name of commodity and the commodity index data, and using the score index to find with each of the customer commodity data corresponding to the matching degree of the highest electric commodity data and business data related goods. The intelligent SKU matching method adopted by the invention has the advantages of strong intelligence and high matching accuracy.

【技术实现步骤摘要】

本专利技术涉及一种数据匹配方法,尤其涉及一种智能SKU匹配方法
技术介绍
现有的SKU匹配方法普遍存在匹配精确度低、定位准确度差的问题。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,而提供一种智能SKU匹配方法,具有智能型强、匹配精确度高的优点。实现上述目的的技术方案是:本专利技术的一种智能SKU匹配方法,包括步骤:输入客户SKU数据并存储于一数据库单元,所述客户SKU数据包括一或复数个客户商品名称数据以及和每一所述客户商品名称数据关联的客户商品相关数据;输入电商SKU数据并存储于所述数据库单元,所述电商SKU数据包括复数个电商商品名称数据以及和每一电商商品名称关联的电商商品相关数据;提取每一所述客户商品名称数据的关键词序列并根据所述关键词序列生成所述客户SKU数据的评分索引;去除每一所述电商商品名称数据的干扰数据并形成商品索引;将每一所述客户商品名称数据与所述商品索引进行匹配,并利用所述评分索引寻找到与每一所述客户商品名称数据对应的匹配度最高的电商商品名称数据和电商商品相关数据。本专利技术的进一步改进在于,所述提取每一所述客户商品名称数据的关键词序列步骤进一步包括步骤:a、去除当前所述客户商品名称数据中特殊符号两侧的空格符号,获得一第一字符串;b、对所述第一字符串进行最大词长切分,并提取形成一第一词汇数组;c、过滤所述词汇数组中的重复词,获得一第二词汇数组;d、对所述第二词汇数组进行分词,获得一第三词汇数组;e、通过预先设置的一过滤模板对所述第三词汇数组进行过滤,获得当前所述客户商品名称数据的关键词以及由所述关键词组成的关键词数组;f、根据所述关键词数组生成所述关键词序列。本专利技术的进一步改进在于,所述根据所述关键词数组生成所述关键词序列步骤进一步包括步骤:当所述客户商品名称数据个数为一个时,根据当前获得的所述关键词数组生成所述关键词序列;否则重复步骤a-e,获取所有所述客户商品名称数据的关键词数组,并根据所述关键词数组生成所述关键词序列。本专利技术的进一步改进在于,所述生成所述客户SKU数据的评分索引步骤进一步包括步骤:筛选出所述关键词序列中的公用词,形成公用词列表;通过一算法和所述公用词列表,计算所述关键词序列中的每一关键词的公用词评分和个性词评分,并将所述公用词评分和个性词评分的评分数据存入所述客户SKU数据中,形成所述评分索引。本专利技术的进一步改进在于,所述筛选出所述关键词序列中的公用词,形成公用词列表步骤进一步包括步骤:将所述关键词序列中的关键词加入一初始序列,累计每一所述关键词在所述关键词序列中的出现次数;若所述关键词在所述关键词序列中的出现次数小于所述关键词序列中关键词总数的一固定百分比,则将当前所述关键词自所述初始序列中移除,形成所述公用词列表。本专利技术的进一步改进在于,所述固定百分比为25%。本专利技术的进一步改进在于,所述通过一算法和所述公用词列表,计算所述关键词序列中的每一关键词的公用词评分和个性词评分步骤进一步包括步骤:设定一公用词分值和一个性词分值,并分别对所述公用词分值和所述个性词分值附初值,且所述公用词分值和所述个性词分值的和为一定值;将所述公用词与所述关键词列表中的关键词取交集,并获取所述交集的交集长度值;如所述交集长度值为0,则将所述个性词分值设为100;如所述交集长度值等于所述关键词长度值,将所述公用词分值设为100;公用词评分=公用词分值/交集长度值;个性词评分=个性词分值/(关键词长度值-交集长度值)。本专利技术的进一步改进在于,所述去除每一所述电商商品名称数据的干扰数据并形成商品索引步骤包括:预设一量词模板;通过所述量词模板对所述每一所述电商商品名称数据进行量词过滤,获得第二字符串;对所述第二字符串进行分词并过滤重复词,获得第三字符串;通过所述第三字符串形成所述商品索引。本专利技术的进一步改进在于,所述利用所述评分索引寻找到与每一所述客户商品名称数据对应的匹配度最高的电商商品名称数据和电商商品相关数据步骤进一步包括步骤:将所述商品索引中匹配到的第三字符串加入一结果列表中;根据所述评分索引计算每一所述第三字符串中包含的公用词评分总和;根据所述公用词评分总和数值大小进行排序;将所述结果列表中所述公用词评分总和数值最大的第三字符串对应的电商商品名称数据和电商商品相关数据作为与当前所述客户商品名称数据对应的匹配度最高的电商商品名称数据和电商商品相关数据。本专利技术的进一步改进在于,所述客户商品相关数据包括:客户商品编号数据和客户商品描述数据;所述电商商品相关数据包括:电商商品编号数据、电商商品描述数据和商品标签数据。本专利技术由于采用了以上技术方案,使其具有以下有益效果是:去除每一所述电商商品名称数据的干扰数据,从而降低了后续匹配过程的复杂、增强了后续匹配的精确性和效率;通过将每一所述客户商品名称数据与所述商品索引进行匹配,并利用所述评分索引寻找到与每一所述客户商品名称数据对应的匹配度最高的电商商品名称数据和电商商品相关数据的步骤实现了客户商品名称数据与电商商品名称数据和电商商品相关数据的高精度的匹配。附图说明图1为本专利技术智能SKU匹配方法的流程图。具体实施方式下面结合具体实施例对本专利技术作进一步说明。请参阅图1,本专利技术的一种智能SKU匹配方法,包括步骤:首先,输入客户SKU数据并存储于一数据库单元,客户SKU数据包括一或复数个客户商品名称数据以及和每一客户商品名称数据关联的客户商品相关数据,其中,客户商品相关数据包括:客户商品编号数据和客户商品描述数据;然后,输入电商SKU数据并存储于数据库单元,电商SKU数据包括复数个电商商品名称数据以及和每一电商商品名称关联的电商商品相关数据,其中电商商品相关数据包括:电商商品编号数据、电商商品描述数据和商品标签数据;接着,提取每一客户商品名称数据的关键词序列并根据关键词序列生成客户SKU数据的评分索引;其中提取每一客户商品名称数据的关键词序列步骤进一步包括步骤:a、去除当前客户商品名称数据中特殊符号两侧的空格符号,获得一第一字符串;b、对第一字符串进行最大词长切分,并提取形成一第一词汇数组;c、过滤词汇数组中的重复词,获得一第二词汇数组;...

【技术保护点】
一种智能SKU匹配方法,其特征在于,包括步骤:输入客户SKU数据并存储于一数据库单元,所述客户SKU数据包括一或复数个客户商品名称数据以及和每一所述客户商品名称数据关联的客户商品相关数据;输入电商SKU数据并存储于所述数据库单元,所述电商SKU数据包括复数个电商商品名称数据以及和每一电商商品名称关联的电商商品相关数据;提取每一所述客户商品名称数据的关键词序列并根据所述关键词序列生成所述客户SKU数据的评分索引;去除每一所述电商商品名称数据的干扰数据并形成商品索引;将每一所述客户商品名称数据与所述商品索引进行匹配,并利用所述评分索引寻找到与每一所述客户商品名称数据对应的匹配度最高的电商商品名称数据和电商商品相关数据。

【技术特征摘要】
1.一种智能SKU匹配方法,其特征在于,包括步骤:
输入客户SKU数据并存储于一数据库单元,所述客户SKU数据包括一
或复数个客户商品名称数据以及和每一所述客户商品名称数据关联的客
户商品相关数据;
输入电商SKU数据并存储于所述数据库单元,所述电商SKU数据包括
复数个电商商品名称数据以及和每一电商商品名称关联的电商商品相关
数据;
提取每一所述客户商品名称数据的关键词序列并根据所述关键词序
列生成所述客户SKU数据的评分索引;
去除每一所述电商商品名称数据的干扰数据并形成商品索引;
将每一所述客户商品名称数据与所述商品索引进行匹配,并利用所述
评分索引寻找到与每一所述客户商品名称数据对应的匹配度最高的电商
商品名称数据和电商商品相关数据。
2.根据权利要求1所述的智能SKU匹配方法,其特征在于:所述提
取每一所述客户商品名称数据的关键词序列步骤进一步包括步骤:
a、去除当前所述客户商品名称数据中特殊符号两侧的空格符号,获
得一第一字符串;
b、对所述第一字符串进行最大词长切分,并提取形成一第一词汇数
组;
c、过滤所述词汇数组中的重复词,获得一第二词汇数组;
d、对所述第二词汇数组进行分词,获得一第三词汇数组;
e、通过预先设置的一过滤模板对所述第三词汇数组进行过滤,获得
当前所述客户商品名称数据的关键词以及由所述关键词组成的关键词数
组;
f、根据所述关键词数组生成所述关键词序列。
3.根据权利要求2所述的智能SKU匹配方法,其特征在于:所述根

\t据所述关键词数组生成所述关键词序列步骤进一步包括步骤:
当所述客户商品名称数据个数为一个时,根据当前获得的所述关键词
数组生成所述关键词序列;
否则重复步骤a-e,获取所有所述客户商品名称数据的关键词数组,
并根据所述关键词数组生成所述关键词序列。
4.根据权利要求3所述的智能SKU匹配方法,其特征在于:所述生
成所述客户SKU数据的评分索引步骤进一步包括步骤:
筛选出所述关键词序列中的公用词,形成公用词列表;
通过一算法和所述公用词列表,计算所述关键词序列中的每一关键词
的公用词评分和个性词评分,并将所述公用词评分和个性词评分的评分数
据存入所述客户SKU数据中,形成所述评分索引。
5.根据权利要求4所述的智能SKU匹配方法,其特征在于:所述筛
选出所述关键词序列中的公用词,形成公用词列表步骤进一步包括步骤:
...

【专利技术属性】
技术研发人员:何发斌王彬徐海峰周艳
申请(专利权)人:上海久科信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1