判断任意两个技术系统相似程度的方法技术方案

技术编号:27213549 阅读:27 留言:0更新日期:2021-02-04 11:29
本申请公开了一种判断任意两个技术系统相似程度的方法,该方法利用具有逐级特征的技术分类规则,对从两个技术系统中选择的技术要点进行技术分类,生成两个分类号码集合,再利用两个分类号码集合中分类号码指示的每一个级别编码,得到两个分类号码集合中每一个级别编码重合的数量,进一步利用该重复数量计算两个分类号码集合的技术相关指数和两个技术系统的相似性概率或冲突概率,该相似性概率或冲突概率就是两个技术系统相似程度。突概率就是两个技术系统相似程度。突概率就是两个技术系统相似程度。

【技术实现步骤摘要】
判断任意两个技术系统相似程度的方法


[0001]本申请涉及互联网络数据处理领域,尤其涉及判断任意两个技术系统相似程度的方法。

技术介绍

[0002]通过整体相似技术系统的寻找和研究,有利于发现或规避市场竞争中可能发生的竞争风险,或者发现有利的参考技术,等等。然而,目前还没有一种有效且快速的方法能够帮助人们快速寻找整体上相似的技术系统或体系。
[0003]因此,人们经常需要寻找整体上相似的技术系统或体系,以便寻找合作者或进行技术参考或判断市场竞争风险。另外,对于任何一个企业来说,通常会有多个已知或未知的竞争性系统存在,寻找与自有技术系统最接近的其它技术系统,判断其相似性程度或竞争竞争性程度,就成为一种需要解决的现实需求。
[0004]通常,人们在寻找整体上相似的技术系统或体系时,会利用论文或专利技术信息,然而,单纯的论文能够提供的信息是极其有限的,无法支撑两个技术系统的技术相似性判断。如果利用专利信息,由于专利申请数量巨大以及专利本身只是一个解决技术问题的方案,由于一个技术系统理论上由无数个解决不同技术问题的方案经过复杂的联系组成,使用个别的专利信息判断两个技术系统的技术相似性,也是管中窥豹,难以实现。另外,专利申请数量的巨大也会导致通过检索快速获知与专利技术最接近的专利本身就具有不确定性,而且还可能产生巨大的数据处理量,而且不利于以自动化的方式实施,更无法给出两个技术系统相似或冲突程度的定量判断。

技术实现思路

[0005]基于上述技术问题,本申请的目的在于提供一种数据处理量较小、有利于以自动化方式实施的判断任意两个技术系统相似程度的方法。
[0006]本申请提供的判断任意两个技术系统相似程度的方法采用下述方案:
[0007]确定或选择一个具有包括至少两级具有逐级特征的技术分类规则;
[0008]分别从两个技术系统A、B中选择技术要点,得到对应的技术要点集合A、B;使用所述技术分类规则对技术要点集合A、B中的技术要点进行技术分类,得到对应的分类号码集合A、B;
[0009]在分类号码集合A中,选择M%的分类号码,获取每一个号码指示的每一个级别编码,得到M%的号码中的全部分类号码的每一个级别编码构成的集合X1i及对应的数量Y1i,以及,在分类号码集合B中,选择N%的分类号码,获取每一个号码指示的每一个级别编码,得到N%的号码中的全部分类号码的每一个级别编码集合X2i及对应的数量Y2i;其中,所述集合中的信息是去除重复以后的信息;
[0010]根据所述编码集合X1i、X2i,计算X1i、X2i中每一个级别编码重合的数量Ei;
[0011]根据Y1i、Y2i和Ei,计算分类号码集合A、B的每一个级别的编码相对重合度Ai、Bi;
其中,对于分类号码集合A,Ai=(Ei/Y1i)%;对于分类号码集合B,Bi=(Ei/Y2i)%;
[0012]根据所述相对重合度Ai、Bi,计算分类号码集合A技术相关指数F
A
和分类号码集合B的技术相关指数F
A
;其中,
[0013]F
A
=∑Ci*Ai;F
B
=∑Ci*Bi;其中,Ci为经验常数;
[0014]根据所述相关指数F
A
和F
B
,计算分类号码集合A、B的相似性概率G
A
、G
B

[0015]G
A
=F
A
/(∑Ci);G
B
=F
B
/(∑Ci);
[0016]其中,G
A
是技术系统A与技术系统B的相似度;G
B
是技术系统B与技术系统A的相似度;
[0017]上述式中,i=1-n,其中n为技术分类规则的编码级别数。
[0018]本申请利用具有逐级特征的技术分类规则对技术系统中技术要点对应的方案进行分类,这样使得技术方案的分类号呈现级别或抽象特性,这样就可以结合结束要点的多样性,就可以通过技术要点的分类规则在整体上体现一个技术系统的全面性、层次性、特点突出性等全面、可识别的特征。从绝对角度看,这些特征本身由于难以确定衡量标准而无法量化表达一个系统特性,但是,恰好通过相对的方式,在判断任意两个技术系统相似程度的方法中实现了量化表达。同时,由于利用了技术分类规则,使得可以通过有限的技术要点实现技术系统的全面系统的表达,不但减少了数据处理量,还有利于以软件数据处理的自动化方式实施本申请提供的技术方案,即减少了人为因素的干扰,又提高的方法的事实效率。另外,本申请利用了技术要点在技术系统中分布的不确定性而实现技术系统整体表达的相对确定性,克服了传统思想中,局部难以表达整体的思维障碍。
附图说明
[0019]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0020]图1给出了本申请的第一个实施例流程图;
[0021]图2给出了本申请的第四个实施例流程图。
具体实施方式
[0022]由于一个技术系统是多个不同层次、不同内容技术方案的有机集合,这些技术方案可能属于不同的领域或学科,可能有关联,也可能完全没有联系,例如一个发动机系统的技术方案,就会涉及机械类、材料类、电路控制类、软件控制类等方案,从技术方案角度看,它们彼此可能没有任何直接的关系。另外,一个技术方案可能在不同的技术系统中都可以使用,因此,从技术方案本身来看,可能完全无法反映一个技术系统,通常我们不会通过具体的个体技术方案去判断技术系统整体的性质,况且,不能用局部代替整体是公知常识。这就导致了利用技术方案的个体信息判断两个技术系统的相似性或竞争性的程度极其困难,在思想上和操作方法上都存在障碍。
[0023]有很多原因会导致一个技术系统理论上有无数种描述,这些描述甚至能够被认为是属于不同的技术系统。但是,两个技术系统的相似性或竞争性的程度还是能够通过一些
信息反应出来。例如,两个技术系统整体上的相似性程度越高,越会在较高的抽象层次上有反应,越倾向于局部的相似,越能够在较低的抽象层次上有反应,利用这一点,我们就有机会通过对一个技术系统不同抽象层次的多个概括描述,来判断两个技术系统的相似性或竞争性的程度。
[0024]本申请第一个实施例给出了一个通用的方案,它采用的原理是,为了从整体上描述一个技术系统,将一个技术系统的关键技术方案用四个抽象层次(也可以是更多的层次或更少的层次,但是不能少于两个层次,过多的层次会使方法的效率降低,且对判断的准确性提升程度有限)的概括描述去表达,根据两个技术系统关键技术方案每个层次的表达数量的统计和比较,就可以快速判断两个技术系统的相似性或竞争性的程度。参考图1。
[0025]在步骤1,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.判断任意两个技术系统相似程度的方法,其特征在于:确定或选择一个具有包括至少两级具有逐级特征的技术分类规则;分别从两个技术系统A、B中选择技术要点,得到对应的技术要点集合A、B;使用所述技术分类规则对技术要点集合A、B中的技术要点进行技术分类,得到对应的分类号码集合A、B;在分类号码集合A中,选择M%的分类号码,获取每一个号码指示的每一个级别编码,得到M%的号码中的全部分类号码的每一个级别编码构成的集合X1i及对应的数量Y1i,以及,在分类号码集合B中,选择N%的分类号码,获取每一个号码指示的每一个级别编码,得到N%的号码中的全部分类号码的每一个级别编码集合X2i及对应的数量Y2i;其中,所述集合中的信息是去除重复以后的信息;根据所述编码集合X1i、X2i,计算X1i、X2i中每一个级别编码重合的数量Ei;根据Y1i、Y2i和Ei,计算分类号码集合A、B的每一个级别的编码相对重合度Ai、Bi;其中,对于分类号码集合A,Ai=(Ei/Y1i)%;对于分类号码集合B,Bi=(Ei/Y2i)%;根据所述相对重合度Ai、Bi,计算分类号码集合A技术相关指数F
A
和分类号码集合B的技术相关指数F
A
;其中,F
A
=∑Ci*Ai;F
B
=∑Ci*Bi;其中,Ci为经验常数;根据所述相关指数F
A
和F
B
,计算分类号码集合A、B的相似性概率G
A
、G
B
;G
A
=F
A
/(∑Ci);G
B
=F
B
/(∑Ci);其中,G
A
是技术系统A与技术系统B的相似度;G
B
是技术系统B与技术系统A的相似度;上述式中,i=1-n,其中n为技术分类规则的编码级别数。2.判断任意两个技术系统相似程度的方法,其特征在于:分别获取第一个技术系统M%专利量的国际专利分类号指示的部编码集合B5、数量b5,大类编码集合B4、数量b4,小类编码集合B3、数量b3,大组编码集合B2、数量b2,和小组编码集合B1、数量b1;以及获取第二个技术系统N%专利量的国际专利分类号指示的部编码集合D5、数量d5,大类编码集合D4、数量d4,小类编码集合D3、数量d3,大组编码集合D2、数量d2,和小组编码集合D1、数量d1;其中,100≥M>0;100≥N>0,所述集合中的信息是去除重复以后的信息;根据所述二个技术系统的部编码集合B5、D5、大类编码集合B4、D4、小类编码集合B3、D3、大组编码集合B2、D2和小组编码集合B1、D1,计算二个技术系统部编码重合的数量E5、大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1;根据任意一个技术系统的部编码数量b5、d5,大类编码数量b4、d4,小类编码数量b3、d3,大组编码数量b2、d2,和小组编码数量b1、d1,以及二个技术系统部编码重合的数量E5、大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1,计算两个技术系统的部编码重合度A5、B5,大类编码重合度A4、B4,小类编码重合度A3、B3,大组编码重合度A2、B2和小组编码重合度A1、B1;其中,对于第一个技术系统,A5=(E5/b5)%,A4=(E4/b4)%,A3=(E3/b3)%,A2=(E2/b2)%,A1=(E1/b1)%;对于第二个技术系统,B5=(E5/d5)%,B4=(E4/d4)%,B3=(E3/d3)%,B2=(E2/
d2)%,B1=(E1/d1)%;根据所述重合度A5、B5,A4、B4,A3、B3,A2、B2,A1、B1,计算任意一个技术系统相对另一个技术系统的专利技术相关指数F
A
或F
B
;其中,对于第一个技术系统,F
A
=C5*A5+C4*A4+C3*A3+C2*A2+C1*A1;对于第二个技术系统,F
B
=C5*B5+C4*B4+C3*B3+C2*B2+C1*B1;其中,C5、C4、C3、C2、C1为经验常数;根据所述相关指数F,计算任意一个技术系统相对另一个技术系统的相似性概率或冲突概率G;G
A
=F
A
/(C5+C4+C3+C2+C1);G
B
=F
B
/(C5+C4+C3+C2+C1);其中,G
A
是技术系统A与技术系统B的相似度;G
B
是技术系统B与技术系统A的相似度。3.如权利要求2所述的方法,其特征在于:所述M、N的数值范围为:100≥M≥50;100≥N≥50;所述M、N的优选数值为100。4.如权利要求2或3所述的方法,其特征在于:所述M等于N。5.判断任意两个技术系统相似程度的方法,其特征在于:分别获取第一个技术系统M%专利量的国际专利分类号指示的大类编码集合B4、数量b4,小类编码集合B3、数量b3,大组编码集合B2、数量b2,和小组编码集合B1、数量b1;以及获取第二个技术系统N%专利量的国际专利分类号指示的大类编码集合D4、数量d4,小类编码集合D3、数量d3,大组编码集合D2、数量d2,和小组编码集合D1、数量d1;其中,100≥M>0;100≥N>0,所述集合中的信息是去除重复以后的信息;根据所述二个技术系统的大类编码集合B4、D4、小类编码集合B3、D3、大组编码集合B2、D2和小组编码集合B1、D1,计算二个技术系统大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1;根据任意一个技术系统的大类编码数量b4、d4,小类编码数量b3、d3,大组编码数量b2、d2,和小组编码数量b1、d1,以及二个技术系统大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1,计算两个技术系统的大类编码重合度A4、B4,小类编码重合度A3、B3,大组编码重合度A2、B2和小组编码重合度A1、B1;其中,对于第一个技术系统,A4=(E4/b4)%,A3=(E3/b3)%,A2=(E2/b2)%,A1=(E1/b1)%;对于第二个技术系统,B4=(E4/d4)%,B3=(E3/d3)%,B2=(E2/d2)%,B1=(E1/d1)%;根据所述重合度A4、B4,...

【专利技术属性】
技术研发人员:白杰李冬云吴先锋
申请(专利权)人:傲为信息技术江苏有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1