当前位置: 首页 > 专利查询>株式会社IPB专利>正文

类似率算出装置和类似率算出程序制造方法及图纸

技术编号:2848423 阅读:137 留言:0更新日期:2012-04-11 18:40
本发明专利技术目的在于提供一种算出用于判断由技术文献构成的技术文献群彼此的技术类似性的指标的类似率算出装置。因此具有:输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置(365);输入技术信息的技术信息输入装置(371);对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置(380);算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数的比的类似率算出装置(380);以及输出上述算出了的类似率的输出装置(365)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及比较技术文献群彼此而判断类似性的类似率算出装置和类似率算出程序
技术介绍
以前的专利图(パテントマツプ)是用专利文献对于相同或类似的研究开发题目的内容进行技术比较,可获知整体动向、分布。并且,经营者看着专利图,就可分析市场动向、技术动向、参入企业和竞争对手企业动向、前途等经营判断的要素。还有,在专利图中,在需要以与A公司关联的技术文献A群和与B公司关联的技术文献B群进行宏观比较的场合,微观地比较从属于技术文献A群和技术文献B群的各个技术文献,从而宏观地导出技术文献群间的比较。图19是表示一个个微观地比较技术文献A群中包含的技术文献和技术文献B群中包含的技术文献的以前的比较状况的图。如图19所示,在把技术文献A群中记载的技术与比较对象的技术文献B群的技术进行比较的场合,以前是对于技术文献A群中包含的技术文献(专利公报、技报等)和技术文献B群中包含的技术文献(专利公报、技报等)的组合,一个个微观地进行比较,将其作为微观类似率而数值化,求出其平均、离散,从而作成2个技术文献群间的比较数值(例如,“专利图引导”,专利厅,参照平成14年8月4日检索,互联网<http://www5.ipdl.jpo.go.jp/pmgsl/pmgsl/pmgs>,以下称为非专利文献1)。在特开2000-348015号公报中记载的知识财产评价装置等中记载了评价与申请中或登记后的专利技术等有关的知识财产的财产价值的知识财产评价装置,即具有以下装置的知识财产评价装置、知识财产评价方法等输入与实施利润有关的数据的实施利润输入装置;输入与每年的复利现价率有关的数据的复利现价率输入装置;乘以与由上述实施利润输入装置输入了的每年的复利现价率有关的数据,算出每年的补偿金年额的复利现价率的复利现价算出装置;对于由上述复利现价算出装置算出了的每年的补偿金年额的复利现价,按各年进行合计,从而算出知识财产价额的知识财产价格算出装置;以及输出由上述知识财产价格算出装置算出了的知识财产价额的输出装置。该知识财产评价装置等是对登记了的专利(特許)和与其关联的销售额、利润等进行减价折旧,以便把握现存的专利的资产价值的东西。另外,在该专利技术中,各专利的价值的评价是把分等级输入了本公司评价、其它公司评价等所得的东西作为贡献度来进行评价的,可算出未进行具体的实施权设定的知识财产的资产价值。在特开2001-76042号公报中记载的系统等中,记载了根据具有规定的更新间隔的第1数据和更新间隔比该第1数据短的第2数据来评价会随时间而变动的评价项目的系统,即,具有以下装置的用于评价会随时间而变动的评价对象的评价项目的系统、方法和记录介质(a)按照取样对象的第1数据的输入,作成第1评价模型的装置;(b)对第1评价模型适用上述取样对象的第1数据,算出第1评价输出的装置;(c)按照取样对象的第2数据和第1评价输出的输入,作成第2评价模型的装置;(d)按照评价对象的第1数据的输入,对第1评价模型适用该第1数据,算出第2评价输出的装置;以及(e)对第2评价模型适用上述评价对象的第2数据和上述第2评价输出,算出该评价对象的评价输出的装置。在该系统中,可对于像来自每1年单位和季度单位进行更新的租赁对照表、损益计算书等的财务数据等那样,进行根据更新间隔比较长的第1数据来算出的分等级数据、破产概率等企业评价的模型(静态模型)和基于像每天变动的股票价格或利息、汇兑等那样更新间隔比较短的第2数据的输入来预测此后的变化,动态地进行企业评价的模型(动态模型)2个评价模型,适用评价对象的企业数据,算出适时、最新的企业评价。还有,在特开平8-287081号公报、特开2001-337992号公报、特开平10-74205号公报、特开平8-278982号公报、特开平11-73415号公报和特开2001-331527号公报中,介绍了在检索与某文件或文章类似的内容的文件或文章时,文件或文章彼此的类似度或可信性高,可高精度地检索类似文件的类似文件检索装置或类似检索系统等。
技术实现思路
然而,在非专利文献1中记载的专利图或特开平8-287081号公报、特开2001-337992号公报、特开平10-74205号公报、特开平8-278982号公报、特开平11-73415号公报和特开2001-331527号公报中记载的专利技术中,例如,即使要求在与A公司关联的技术文献A群和与B公司关联的技术文献B群之间对技术文献中记载的内容进行宏观比较,以前也是对从属于技术文献A群和技术文献B群的各个技术文献彼此一个个进行微观比较,根据其多个运算结果来导出宏观技术文献群间的比较,因而工作效率差,这是存在的问题。还有,在非专利文献1中记载的专利图中,可按技术比较中相同或类似的研究开发题目的内容,获知整体动向或分布,不过,不能在企业间算出把企业整体的总技术文献作为母集团的各技术的相对的评价,因而作为无形资产的价值评价手法,不能获得定量、定性的结果,不能算出成为信托或投资的评价的对象、企业的专利战略的决定因素的技术评价的指标,这是存在的问题。还有,如果采用对该微观类似率进行平均的计算方法的话,例如在图19所示的场合,在技术文献群A和技术文献B群完全不同的场合,类似率算出为0。还有,以全部组合求出的平均的类似率也为0,因而看起来好象没有问题。然而,即使在第1技术文献群和第2技术文献群完全相同的场合,对于第1技术文献群中包含的技术文献A1,求出第2技术文献群中包含的技术文献B1、B2、B3、B4的微观类似率的话,在2个技术文献完全相同的场合(A1=B1等),算出A1和B1的类似率为1,不过,在此外的场合,一般而言类似率不为1。以再对A1以外的A2、A3、A4等的所有组合求出的平均类似率为1及其以下的数值的平均,因而类似率还是不会算出为1,这是存在的问题。还有,像在技术文献的总数为数万件以上的场合那样,对于大量的技术文献彼此算出类似率时,需要对于所有技术文献的组合计算类似率,因而在算出类似率时的计算量庞大,需要大量计算时间,不能快速地显示类似率的计算结果,这是存在的问题。还有,在像以前那样算出类似率时,用关键字切分调查对象和母集团的技术文献,运算包含各个关键字的技术文献的数量和技术文献的总数的比率,对于与所有关键字有关而运算出的比率进行平均,算出类似率的方法中,不进行与关键字的重要性对应的加权的话,算出的类似率和实际感觉的类似率的差就会很大,这是存在的问题。在用该加权了的关键字来算出类似率时,对于全关键字,操作者可进行加权,作成同义词词典,基于其加权而算出类似率。这在理论上是可能的,不过,实际上对庞大的量的关键字分别加权是相当麻烦的工作(极难的工作),不适于处理的自动化。还有,对于每个技术文献算出类似率这一点没有变化,因而结果仍然是微观地比较技术文献彼此,这是存在的问题。还有,在非专利文献1中记载的专利图中,专利图作成支援软件的价格是约15万~50万日元的程度,其操作不仅需要计算机,而且需要诸如读取权利要求、附图等的高度技术力和知识力。即使在专利调查机关委托的场合,每1件也需要30万日元以上的费用,并且需要约1个月以上的作成时间。因此,在资本金或开发费少的风险型企业等利用的场合,或是急于申请的场合,专利图的本文档来自技高网
...

【技术保护点】
一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有:    输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;    输入关键字、IPC等技术信息的技术信息输入装置;    对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;    把上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数的比作为类似率而算出的类似率算出装置;以及    把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。

【技术特征摘要】
【国外来华专利技术】JP 2003-9-30 341904/20031.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;把上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数的比作为类似率而算出的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。2.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把取与各混合簇中包含的技术文献的量对应的值的第1补正值和取与各混合簇中包含的第1技术文献群的技术文献和第2技术文献群的技术文献的掺混情形对应的值的第2补正值相乘所得的东西对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。3.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把与各个簇内的技术文献数的α次幂(此处,0<α)成比例的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。4.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把将各个簇内的技术文献数的α次幂(此处,0<α)除以归一化因子所得的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。5.根据权利要求4所述的类似率算出装置,其特征在于,所述归一化因子是全簇内的技术文献数的平均值。6.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且为了按照上述簇分解的结果所获得的混合簇中包含的第1技术文献群和第2技术文献群的技术文献数的概率进行补正,把与从第1技术文献群中取出m个,从第2技术文献群中取出n个技术文献的概率的γ次幂(此处,0<γ)成比例的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。7.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且为了按照上述簇分解的结果所获得的混合簇中包含的第1技术文献群和第2技术文献群的技术文献数的概率进行补正,把将从第1技术文献群中取出m个,从第2技术文献群中取出n个技术文献的概率的γ次幂(此处,0<γ)除以归一化因子所得的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。8.根据权利要求7所述的类似率算出装置,其特征在于,所述归一化因子是从第1技术文献群中取出m个,从第2技术文献群中取出n个技术文献的概率的最大值的γ次幂(此处,0<γ)。9.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且对于第1技术文献群中包含的技术文献数M和第2技术文献群中包含的技术文献数N的构成比N/M和上述簇分解的结果所获得的混合簇中包含的第1技术文献群的技术文献数m和第2技术文献群的技术文献数n的混合比n/m,再把与取得了构成比和混合比的比的东西的ζ次幂(此处,0<ζ)成比例的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。10.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且对从混合了第1技术文献群和第2技术文献群的技术文献群中取出第1技术文献群的技术文献的概率乘以上述簇分解了的混合簇中包含的技术文献数,算出取出第1技术文献群的技术文献的期望值,作为期望值差而算出上述期望值和混合簇中包含的第1技术文献群的技术文献数的差,把将该期望值差作为任意常数ξ(此处,1<ξ)的负的指数所得的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。11.一种类似率算出装置,算出用于判断由专利文献或技报等技术文献构成的第1技术文献群和第2技术文献群的技术类似性的指标,其特征在于具有输入成为比较对象的第1技术文献群和第2技术文献群的技术文献群输入装置;输入关键字、IPC等技术信息的技术信息输入装置;对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的簇分解装置;算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且对从混合了第1技术文献群和第2技术文献群的技术文献群中取出第1技术文献群的技术文献的概率乘以上述簇分解了的混合簇中包含的技术文献数,算出取出第1技术文献群的技术文献的期望值,作为期望值差而算出上述期望值和混合簇中包含的第1技术文献群的技术文献数的差,把该期望值差除以混合簇中包含的技术文献数,把所得的东西作为任意常数ξ(此处,1<ξ)的负的指数而得到补正值,将其对于各混合簇算出总和,再除以上述算出了的全簇数,算出类似率的类似率算出装置;以及把上述算出了的类似率向记录装置、显示装置或通信装置输出的输出装置。12.一种类似率算出程序,借助于类似率算出装置的信息处理装置而工作,算出用于判断技术文献群彼此的技术类似性的指标,所述类似率算出装置具有输入技术文献群的技术文献群输入装置、输入关键字等技术信息的技术信息输入装置、把技术文献按技术信息进行簇分解的簇分解装置、算出全簇数和混合簇数并算出类似率的类似率算出装置、输出算出了的类似率的输出装置以及可控制上述技术文献群输入装置、技术信息输入装置、簇分解装置、类似率算出装置和输出装置的信息处理装置,所述类似率算出程序的特征在于,所述信息处理装置,使所述技术文献群输入装置实现输入成为比较对象的第1技术文献群和第2技术文献群的功能;使所述技术信息输入装置实现输入关键字、IPC等技术信息的功能;使所述簇分解装置实现对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的功能;使所述类似率算出装置实现算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数的比作为类似率而算出的功能;以及使所述输出装置实现把上述算出了的类似率向记录装置、显示装置或通信装置输出的功能。13.一种类似率算出程序,借助于类似率算出装置的信息处理装置而工作,算出用于判断技术文献群彼此的技术类似性的指标,所述类似率算出装置具有输入技术文献群的技术文献群输入装置、输入关键字等技术信息的技术信息输入装置、把技术文献按技术信息进行簇分解的簇分解装置、算出全簇数和混合簇数并算出类似率的类似率算出装置、输出算出了的类似率的输出装置以及可控制上述技术文献群输入装置、技术信息输入装置、簇分解装置、类似率算出装置和输出装置的信息处理装置,所述类似率算出程序的特征在于,所述信息处理装置,使所述技术文献群输入装置实现输入成为比较对象的第1技术文献群和第2技术文献群的功能;使所述技术信息输入装置实现输入关键字、IPC等技术信息的功能;使所述簇分解装置实现对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的功能;使所述类似率算出装置实现算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把取与各混合簇中包含的技术文献的量对应的值的第1补正值和取与各混合簇中包含的第1技术文献群的技术文献和第2技术文献群的技术文献的掺混情形对应的值的第2补正值相乘所得的东西对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的功能;以及使所述输出装置实现把上述算出了的类似率向记录装置、显示装置或通信装置输出的功能。14.一种类似率算出程序,借助于类似率算出装置的信息处理装置而工作,算出用于判断技术文献群彼此的技术类似性的指标,所述类似率算出装置具有输入技术文献群的技术文献群输入装置、输入关键字等技术信息的技术信息输入装置、把技术文献按技术信息进行簇分解的簇分解装置、算出全簇数和混合簇数并算出类似率的类似率算出装置、输出算出了的类似率的输出装置以及可控制上述技术文献群输入装置、技术信息输入装置、簇分解装置、类似率算出装置和输出装置的信息处理装置,所述类似率算出程序的特征在于,所述信息处理装置,使所述技术文献群输入装置实现输入成为比较对象的第1技术文献群和第2技术文献群的功能;使所述技术信息输入装置实现输入关键字、IPC等技术信息的功能;使所述簇分解装置实现对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的功能;使所述类似率算出装置实现算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把与各个簇内的技术文献数的α次幂(此处,0<α)成比例的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的功能;以及使所述输出装置实现把上述算出了的类似率向记录装置、显示装置或通信装置输出的功能。15.一种类似率算出程序,借助于类似率算出装置的信息处理装置而工作,算出用于判断技术文献群彼此的技术类似性的指标,所述类似率算出装置具有输入技术文献群的技术文献群输入装置、输入关键字等技术信息的技术信息输入装置、把技术文献按技术信息进行簇分解的簇分解装置、算出全簇数和混合簇数并算出类似率的类似率算出装置、输出算出了的类似率的输出装置以及可控制上述技术文献群输入装置、技术信息输入装置、簇分解装置、类似率算出装置和输出装置的信息处理装置,所述类似率算出程序的特征在于,所述信息处理装置,使所述技术文献群输入装置实现输入成为比较对象的第1技术文献群和第2技术文献群的功能;使所述技术信息输入装置实现输入关键字、IPC等技术信息的功能;使所述簇分解装置实现对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的功能;使所述类似率算出装置实现算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且把将各个簇内的技术文献数的α次幂(此处,0<α)除以归一化因子所得的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的功能;以及使所述输出装置实现把上述算出了的类似率向记录装置、显示装置或通信装置输出的功能。16.根据权利要求15所述类似率算出程序,其特征在于,使所述类似率算出装置实现用全簇内的技术文献数的平均值作为所述归一化因子的功能。17.一种类似率算出程序,借助于类似率算出装置的信息处理装置而工作,算出用于判断技术文献群彼此的技术类似性的指标,所述类似率算出装置具有输入技术文献群的技术文献群输入装置、输入关键字等技术信息的技术信息输入装置、把技术文献按技术信息进行簇分解的簇分解装置、算出全簇数和混合簇数并算出类似率的类似率算出装置、输出算出了的类似率的输出装置以及可控制上述技术文献群输入装置、技术信息输入装置、簇分解装置、类似率算出装置和输出装置的信息处理装置,所述类似率算出程序的特征在于,所述信息处理装置,使所述技术文献群输入装置实现输入成为比较对象的第1技术文献群和第2技术文献群的功能;使所述技术信息输入装置实现输入关键字、IPC等技术信息的功能;使所述簇分解装置实现对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的功能;使所述类似率算出装置实现算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文献群两者的技术文献的混合簇数,并且为了按照上述簇分解的结果所获得的混合簇中包含的第1技术文献群和第2技术文献群的技术文献数的概率进行补正,把与从第1技术文献群中取出m个,从第2技术文献群中取出n个技术文献的概率的γ次幂(此处,0<γ)成比例的补正值对于各混合簇算出总和,除以上述算出了的全簇数,算出类似率的功能;以及使所述输出装置实现把上述算出了的类似率向记录装置、显示装置或通信装置输出的功能。18.一种类似率算出程序,借助于类似率算出装置的信息处理装置而工作,算出用于判断技术文献群彼此的技术类似性的指标,所述类似率算出装置具有输入技术文献群的技术文献群输入装置、输入关键字等技术信息的技术信息输入装置、把技术文献按技术信息进行簇分解的簇分解装置、算出全簇数和混合簇数并算出类似率的类似率算出装置、输出算出了的类似率的输出装置以及可控制上述技术文献群输入装置、技术信息输入装置、簇分解装置、类似率算出装置和输出装置的信息处理装置,所述类似率算出程序的特征在于,所述信息处理装置,使所述技术文献群输入装置实现输入成为比较对象的第1技术文献群和第2技术文献群的功能;使所述技术信息输入装置实现输入关键字、IPC等技术信息的功能;使所述簇分解装置实现对于第1技术文献群和第2技术文献群中包含的技术文献,检索包含上述输入了的技术信息的技术文献,把该检索出的技术文献按各个技术信息进行簇分解的功能;使所述类似率算出装置实现算出上述簇分解的结果所获得的全簇数和包含第1技术文献群和第2技术文...

【专利技术属性】
技术研发人员:增山博昭吉野令晃
申请(专利权)人:株式会社IPB
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1