【技术实现步骤摘要】
技术介绍
本专利技术涉及计算机装置、计算机程序和方法,以上三项用于计 算计算机网络上电子文档的重要性,并且尤其涉及计算机装置、计 算机程序和方法,以上三项用于基于包括在第二文档中的关于第一 电子文档的评论来计算第 一 电子文档的重要性,第二文档与被标定 用于计算重要性的第一电子文档相关联。页面、博客等中的大量电子文档之中在短时间内高精确度地查找网 络用户感兴趣的事物。与用户兴趣一致的电子文档对于他/她是高度 重要的。作为用于自动判断计算机网络上web页面的重要性的技术中的 一种技术,Google的PageRank是众所周知的。细节在Lawrence Page、 Sergey Brin、 Rajeev Motwani、 Terry Winograd的The PageRank Citation Ranking: Bringing Order to the Web ( 1998 )中描述。简而言之,PageRank是一种用于在递归关系的基础上判断网络 上的 一组web页面的重要性的技术,其中链接自大量较高质量的web 页面的web页面也是较高质量的web页面。特别地,基于从其他web 页面到特定web页面的链接数量、到由高度推荐的web页面提供的 特定web页面的链接的存在、以及在具有到特定web页面的链接的 页面上的链接数量来计算特定web页面的重要性。换句话说,PageRank是一种用于通过使用web页面之间的链接 来计算每个web页面的相对重要性的技术。PageRank不提供分析第一 web页面的内容、以及基于包括在第 一 web页面的内容中的关于第二 we ...
【技术保护点】
一种方法,基于以下内容计算多个电子文档中的至少一个电子文档的重要性:(i)多个电子文档,(ii)关于每对所述电子文档之间的参考关系的信息,(iii)重要短语,以及(iv)响应系数确定短语,(i)到(iv)存储在存储设备中,所述方法包括以下步骤: (a)在重要短语和包括在所述多个电子文档之中的给定电子文档中的短语之间的相似度的基础上,计算所述给定电子文档的本身重要性, (b)在所述参考信息的基础上,识别至少一个对所述给定电子文档加以参考的其他电子文档, (c)在包括在所述其他电子文档中的短语和响应系数确定短语之间的至少一个相似度的基础上,对照所述给定电子文档计算所述响应系数, (d)在所述给定电子文档的所述本身重要性、所述响应系数、和所述其他电子文档的总重要性的基础上,计算所述给定电子文档的总重要性,以及 (e)通过将(a)到(d)的步骤应用到所述电子文档组中具有直接进行参考和直接被参考的相互关系的每对电子文档中来计算电子文档组中的每个所述电子文档的总重要性,其中所述给定电子文档和所述其他电子文档通过进行参考和被参考的关系在所述参考信息的基础上直接或间接地彼 ...
【技术特征摘要】
JP 2007-1-22 2007-0116331.一种方法,基于以下内容计算多个电子文档中的至少一个电子文档的重要性(i)多个电子文档,(ii)关于每对所述电子文档之间的参考关系的信息,(iii)重要短语,以及(iv)响应系数确定短语,(i)到(iv)存储在存储设备中,所述方法包括以下步骤(a)在重要短语和包括在所述多个电子文档之中的给定电子文档中的短语之间的相似度的基础上,计算所述给定电子文档的本身重要性,(b)在所述参考信息的基础上,识别至少一个对所述给定电子文档加以参考的其他电子文档,(c)在包括在所述其他电子文档中的短语和响应系数确定短语之间的至少一个相似度的基础上,对照所述给定电子文档计算所述响应系数,(d)在所述给定电子文档的所述本身重要性、所述响应系数、和所述其他电子文档的总重要性的基础上,计算所述给定电子文档的总重要性,以及(e)通过将(a)到(d)的步骤应用到所述电子文档组中具有直接进行参考和直接被参考的相互关系的每对电子文档中来计算电子文档组中的每个所述电子文档的总重要性,其中所述给定电子文档和所述其他电子文档通过进行参考和被参考的关系在所述参考信息的基础上直接或间接地彼此链接。2.根据权利要求1所述的方法,其中用于计算所述多个电子文档 中每个电子文档的所述总重要性的步骤从开始电子文档和所述开始 电子文档参考的电子文档构成的 一对电子文档开始,沿着链接朝向 结束电子文档,通过将所述(a)到(d)的步骤依次应用到每对链 接的电子文档来计算所述多个电子文档的每个电子文档的所述总重 要性。3. 根据权利要求1所述的方法,其中用于计算所述给定电子文档 的所述总重要性的步骤在以下内容的基础上进 一 步计算所述给定电子文档的所述总重要性通过之前向所述响应系数和所述其他电子 文档的所述总重要性分别分配预定的权重而获得的值;以及所述给 定电子文档的所述本身重要性。4. 根据权利要求3所述的方法,其中0<所述分配的权重<1。5. 根据权利要求1所述的方法,其中当不存在对所述电子文档对 中的一个电子文档加以参考的电子文档时,用于计算所述多个电子 文档的每个电子文档的所述总重要性的步骤通过在使用所述电子文 档对中的 一个电子文档的所述本身重要性作为其总重要性的情况 下,将所述(a)到(d)的步骤应用到所述电子文档对来计算组成 所述对的所述每个电子文档的所述总重要性。6. 根据权利要求1所述的方法,其中当存在对所述电子文档对中 的一个电子文档加以参考的多个电子文档时,用于计算每个所述电 子文档的所述总重要性的步骤在多个参考电子文档的每一个电子文 档的所述总重要性的基础上计算所述电子文档对中的 一 个电子文档 的所述总重要性。7. 根据权利要求6所述的方法,其中用于计算所述总重要性的步 骤将每个所述进行参考的电子文档的所述总重要性的总和计算作为 所述电子文档对中的一个电子文档的所述总重要性。8. 根据权利要求1所述的方法,其中所述响应系数确定短语包括 以下短语中的至少一个短语(i)同意短语、(ii)不同意短语以 及(iii)主题改变短语。9. 一种计算机程序,所述计算机程序基于以下内容计算每个电子 文档的总重要性(i)从没有被任何其他文档参考的开始电子文档 到没有参考任何其他文档的结束电子文档以进行参考和被参考关系 彼此链连接的多个电子文档,(ii)关于进行参考和被参考关系的信 息,(iii)重要短语,以及(iv)响应系数确定短语,(i)到(iv) 存储在存储设备中,所述计算机程序使计算机执行权利要求1-8中任何一项的方法步骤。10. —种计算机装置,所述计算机装置基于以下内容计算多个电子文档中的至少一个电子文档的重要性(i)所述多个电子文档, (ii)每个所述电子文档之间...
【专利技术属性】
技术研发人员:中村英史,村上明子,那须川哲哉,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。