一种迭代式概念属性名称自动获取方法和系统技术方案

技术编号：7682533 阅读：240 留言：0更新日期：2012-08-16 05:52

本发明专利技术公开一种迭代式概念属性名称自动获取方法和系统，其特征在于，所述方法包括如下步骤：步骤1，将需要获取的概念名称，建立属性空间，所述属性空间包含以属性构成的概念名称；步骤2，从属性空间中选择的属性前缀和/或属性后缀，从网页中提取候选属性；步骤3，采用基于相似性的验证模型对候选属性进行验证，通过迭代方式扩充属性集合。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能计算机领域中的大规模知识获取领域，尤其涉及一种迭代式的概念属性名称自动获取方法和系统。
技术介绍
任何概念词都有一定的语义。但是概念词仅是一个特殊的术语，其直接表达语义的能力非常弱，因此我们必须借助其他类型的知识进一步表达或者刻画概念词所蕴涵的语义。概念的属性就是一种此类的知识。一般认为，属性是一种概念内涵的载体。一个属性描述了概念的一个特征或性质；通过属性，我们可以区分不同的概念，发现它们之间的差异。因此，属性具备描述概念和鉴别概念的功能。每个概念都有一组用于鉴别和修饰的属性，这些属性在文本中表现为不同的属性名称。属性名称是表示属性的专有名词，大多数属性名称都能起到见名知义的作用。我们可以通过获取较常用的概念-属性名称的搭配，给出概念的关键属性集合。有了这个集合，我们就具备描述概念和鉴别概念的能力。另外，属性名称获取也是属性值获取的前一步工作。为方便理解属性的含义，下面我们给出一个例子对地域类的概念“中国”，它有一些属性名称“人口总数”、“人口数量”、“国土面积”、“GDP”等等。其中“人口总数”和“人口数量”具有相同的语义，它们所表达的那个特定的语义就是“人口总数”和“人口数量”所对应的属性，而“人口总数”和“人口数量”则是那个属性的具体的载体——属性名称。通过给出的这些具体的属性名称，我们就能从属性这个角度去认识概念“中国”，同时也能在这个角度上将“中国”和其他类型的概念(比如植物类的概念“苹果”)区分开来。另外，对“中国”的“国土面积”这个属性名称而言，它有一个属性值960万平方公里，属性值获取也是一类重要的知识获取，而获...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：曹存根，汪平仄，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人