【技术实现步骤摘要】
判断任意两个技术系统相似程度的方法
[0001]本申请涉及互联网络数据处理领域,尤其涉及判断任意两个技术系统相似程度的方法。
技术介绍
[0002]通过整体相似技术系统的寻找和研究,有利于发现或规避市场竞争中可能发生的竞争风险,或者发现有利的参考技术,等等。然而,目前还没有一种有效且快速的方法能够帮助人们快速寻找整体上相似的技术系统或体系。
[0003]因此,人们经常需要寻找整体上相似的技术系统或体系,以便寻找合作者或进行技术参考或判断市场竞争风险。另外,对于任何一个企业来说,通常会有多个已知或未知的竞争性系统存在,寻找与自有技术系统最接近的其它技术系统,判断其相似性程度或竞争竞争性程度,就成为一种需要解决的现实需求。
[0004]通常,人们在寻找整体上相似的技术系统或体系时,会利用论文或专利技术信息,然而,单纯的论文能够提供的信息是极其有限的,无法支撑两个技术系统的技术相似性判断。如果利用专利信息,由于专利申请数量巨大以及专利本身只是一个解决技术问题的方案,由于一个技术系统理论上由无数个解决不同技术问题的方案经过复杂的联系组成,使用个别的专利信息判断两个技术系统的技术相似性,也是管中窥豹,难以实现。另外,专利申请数量的巨大也会导致通过检索快速获知与专利技术最接近的专利本身就具有不确定性,而且还可能产生巨大的数据处理量,而且不利于以自动化的方式实施,更无法给出两个技术系统相似或冲突程度的定量判断。
技术实现思路
[0005]基于上述技术问题,本申请的目的在于提供一种数据处理量较小、有利 ...
【技术保护点】
【技术特征摘要】
1.判断任意两个技术系统相似程度的方法,其特征在于:确定或选择一个具有包括至少两级具有逐级特征的技术分类规则;分别从两个技术系统A、B中选择技术要点,得到对应的技术要点集合A、B;使用所述技术分类规则对技术要点集合A、B中的技术要点进行技术分类,得到对应的分类号码集合A、B;在分类号码集合A中,选择M%的分类号码,获取每一个号码指示的每一个级别编码,得到M%的号码中的全部分类号码的每一个级别编码构成的集合X1i及对应的数量Y1i,以及,在分类号码集合B中,选择N%的分类号码,获取每一个号码指示的每一个级别编码,得到N%的号码中的全部分类号码的每一个级别编码集合X2i及对应的数量Y2i;其中,所述集合中的信息是去除重复以后的信息;根据所述编码集合X1i、X2i,计算X1i、X2i中每一个级别编码重合的数量Ei;根据Y1i、Y2i和Ei,计算分类号码集合A、B的每一个级别的编码相对重合度Ai、Bi;其中,对于分类号码集合A,Ai=(Ei/Y1i)%;对于分类号码集合B,Bi=(Ei/Y2i)%;根据所述相对重合度Ai、Bi,计算分类号码集合A技术相关指数F
A
和分类号码集合B的技术相关指数F
A
;其中,F
A
=∑Ci*Ai;F
B
=∑Ci*Bi;其中,Ci为经验常数;根据所述相关指数F
A
和F
B
,计算分类号码集合A、B的相似性概率G
A
、G
B
;G
A
=F
A
/(∑Ci);G
B
=F
B
/(∑Ci);其中,G
A
是技术系统A与技术系统B的相似度;G
B
是技术系统B与技术系统A的相似度;上述式中,i=1-n,其中n为技术分类规则的编码级别数。2.判断任意两个技术系统相似程度的方法,其特征在于:分别获取第一个技术系统M%专利量的国际专利分类号指示的部编码集合B5、数量b5,大类编码集合B4、数量b4,小类编码集合B3、数量b3,大组编码集合B2、数量b2,和小组编码集合B1、数量b1;以及获取第二个技术系统N%专利量的国际专利分类号指示的部编码集合D5、数量d5,大类编码集合D4、数量d4,小类编码集合D3、数量d3,大组编码集合D2、数量d2,和小组编码集合D1、数量d1;其中,100≥M>0;100≥N>0,所述集合中的信息是去除重复以后的信息;根据所述二个技术系统的部编码集合B5、D5、大类编码集合B4、D4、小类编码集合B3、D3、大组编码集合B2、D2和小组编码集合B1、D1,计算二个技术系统部编码重合的数量E5、大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1;根据任意一个技术系统的部编码数量b5、d5,大类编码数量b4、d4,小类编码数量b3、d3,大组编码数量b2、d2,和小组编码数量b1、d1,以及二个技术系统部编码重合的数量E5、大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1,计算两个技术系统的部编码重合度A5、B5,大类编码重合度A4、B4,小类编码重合度A3、B3,大组编码重合度A2、B2和小组编码重合度A1、B1;其中,对于第一个技术系统,A5=(E5/b5)%,A4=(E4/b4)%,A3=(E3/b3)%,A2=(E2/b2)%,A1=(E1/b1)%;对于第二个技术系统,B5=(E5/d5)%,B4=(E4/d4)%,B3=(E3/d3)%,B2=(E2/
d2)%,B1=(E1/d1)%;根据所述重合度A5、B5,A4、B4,A3、B3,A2、B2,A1、B1,计算任意一个技术系统相对另一个技术系统的专利技术相关指数F
A
或F
B
;其中,对于第一个技术系统,F
A
=C5*A5+C4*A4+C3*A3+C2*A2+C1*A1;对于第二个技术系统,F
B
=C5*B5+C4*B4+C3*B3+C2*B2+C1*B1;其中,C5、C4、C3、C2、C1为经验常数;根据所述相关指数F,计算任意一个技术系统相对另一个技术系统的相似性概率或冲突概率G;G
A
=F
A
/(C5+C4+C3+C2+C1);G
B
=F
B
/(C5+C4+C3+C2+C1);其中,G
A
是技术系统A与技术系统B的相似度;G
B
是技术系统B与技术系统A的相似度。3.如权利要求2所述的方法,其特征在于:所述M、N的数值范围为:100≥M≥50;100≥N≥50;所述M、N的优选数值为100。4.如权利要求2或3所述的方法,其特征在于:所述M等于N。5.判断任意两个技术系统相似程度的方法,其特征在于:分别获取第一个技术系统M%专利量的国际专利分类号指示的大类编码集合B4、数量b4,小类编码集合B3、数量b3,大组编码集合B2、数量b2,和小组编码集合B1、数量b1;以及获取第二个技术系统N%专利量的国际专利分类号指示的大类编码集合D4、数量d4,小类编码集合D3、数量d3,大组编码集合D2、数量d2,和小组编码集合D1、数量d1;其中,100≥M>0;100≥N>0,所述集合中的信息是去除重复以后的信息;根据所述二个技术系统的大类编码集合B4、D4、小类编码集合B3、D3、大组编码集合B2、D2和小组编码集合B1、D1,计算二个技术系统大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1;根据任意一个技术系统的大类编码数量b4、d4,小类编码数量b3、d3,大组编码数量b2、d2,和小组编码数量b1、d1,以及二个技术系统大类编码重合的数量E4、小类编码重合的数量E3、大组编码重合的数量E2和小组编码重合的数量E1,计算两个技术系统的大类编码重合度A4、B4,小类编码重合度A3、B3,大组编码重合度A2、B2和小组编码重合度A1、B1;其中,对于第一个技术系统,A4=(E4/b4)%,A3=(E3/b3)%,A2=(E2/b2)%,A1=(E1/b1)%;对于第二个技术系统,B4=(E4/d4)%,B3=(E3/d3)%,B2=(E2/d2)%,B1=(E1/d1)%;根据所述重合度A4、B4,...
【专利技术属性】
技术研发人员:白杰,李冬云,吴先锋,
申请(专利权)人:傲为信息技术江苏有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。