一种关联数据内容的方法及装置制造方法及图纸

技术编号:13296461 阅读:75 留言:0更新日期:2016-07-09 14:42
本发明专利技术提供了一种关联数据内容的方法及装置,该方法,包括:预先设置多个标签;获取待关联的数据内容;对每个所述数据内容进行分词处理,生成每个数据内容的待匹配分词;将每个数据内容的每个待匹配分词与每个标签进行匹配,确定与每个数据内容的每个待匹配分词相匹配的匹配标签;将确定出的每个数据内容对应的所述匹配标签作为每个数据内容的标签;根据每个数据内容的标签,关联所述待关联的数据内容。本发明专利技术提供了一种关联数据内容的方法及装置,能够更加方便的建立数据内容之间的关联关系。

【技术实现步骤摘要】
201610058902

【技术保护点】
一种关联数据内容的方法,其特征在于,包括:预先设置多个标签,还包括:S1:获取待关联的数据内容;S2:对每个所述数据内容进行分词处理,生成每个数据内容的待匹配分词;S3:将每个数据内容的每个待匹配分词与每个标签进行匹配,确定与每个数据内容的每个待匹配分词相匹配的匹配标签;S4:将确定出的每个数据内容对应的所述匹配标签作为每个数据内容的标签;S5:根据每个数据内容的标签,关联所述待关联的数据内容。

【技术特征摘要】
1.一种关联数据内容的方法,其特征在于,包括:预先设置多个标签,
还包括:
S1:获取待关联的数据内容;
S2:对每个所述数据内容进行分词处理,生成每个数据内容的待匹配分
词;
S3:将每个数据内容的每个待匹配分词与每个标签进行匹配,确定与每
个数据内容的每个待匹配分词相匹配的匹配标签;
S4:将确定出的每个数据内容对应的所述匹配标签作为每个数据内容的
标签;
S5:根据每个数据内容的标签,关联所述待关联的数据内容。
2.根据权利要求1所述的方法,其特征在于,还包括:预先设置分词词
典;
所述S2,包括:
扫描每个所述数据内容,从每个所述数据内容中划分出多个待匹配字符
串;
将每个数据内容的每个待匹配字符串与所述分词词典中的词条进行匹
配;
将在所述分词词典中有相匹配的词条的每个数据内容对应的待匹配字符
串作为每个数据内容的待匹配分词。
3.根据权利要求2所述的方法,其特征在于,所述扫描每个所述数据内
容,从每个所述数据内容中划分出多个待匹配字符串,包括:
从每个所述数据内容的所有相邻的字符中,提取出所有的长度小于等于
预设值的字符串,将提取出的字符串作为所述数据内容对应的所述多个待匹
配字符串。
4.根据权利要求1所述的方法,其特征在于,还包括:预先为每种数据

\t类型设置对应的分词处理程序;
所述S2,包括:
确定每个所述数据内容的数据类型;
根据确定出的每个数据内容的数据类型,确定每个数据内容对应的分词
处理程序;
通过确定出的每个数据内容的分词处理程序分别对每个数据内容进行分
词处理,生成每个数据内容的所述待匹配分词。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述S5,包括:
关联具有相同的标签的数据内容;
和/或,所述方法还包括:建立所述多个标签之间的关联关系;
在所述S4之后,还包括:关联具有关联关系的标签的数据内容。
6.一种关联数据内容的装置,其特征在于,包...

【专利技术属性】
技术研发人员:黄河潮郝文祥
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1