This application discloses a data association method and device for heterogeneous data. The method includes: comparing at least two financial data to be correlated to determine whether there are the same attributes in the financial data to be correlated to be compared; and associating the financial data to be correlated with the same attributes, through the above-mentioned method, the financial data with correlated relationship can be obtained. Data are correlated to facilitate the statistical or classification of financial data.
【技术实现步骤摘要】
面向异构数据的数据关联方法和装置
本申请涉及计算机
,具体而言,涉及一种面向异构数据的数据关联方法和装置。
技术介绍
在金融领域中,需要对许多金融数据进行关联,以便对金融数据进行统计或归类,但是由于金融数据的来源不同,从而导致具有关联关系的金融数据的记录方式不同,例如,对于金融数据的名称,有些金融数据记录的是全称,有些金融数据记录的是简称,还有一些金融数据记录的是英文简写,从而导致金融数据不能进行有效关联,上述问题目前尚未提出有效的解决方法。
技术实现思路
本申请的主要目的在于提供一种面向异构数据的数据关联方法和装置,以对金融数据进行关联。为了实现上述目的,本申请提供了一种面向异构数据的数据关联方法,包括:对至少两个待关联金融数据进行两两比对,以确定进行比对的待关联金融数据中是否存在相同的属性;将具有相同属性的待关联金融数据进行关联。可选地,对至少两个待关联金融数据进行两两比对,以确定进行比对的待关联金融数据中是否存在相同的属性包括:确定进行比对的待关联金融数据中的属性的语义和语法的相似度;判断所述相似度是否大于指定阈值;当所述相似度大于或等于所述指定阈值时,确定进行比对的待关联金融数据中存在相同的属性。可选地,当所述相似度小于所述指定阈值时,确定进行比对的待关联金融数据中不存在相同的属性。可选地,在对至少两个待关联金融数据进行两两比对之后,在将具有相同属性的待关联金融数据进行关联之前,所述方法还包括:利用度量学习得到的模型,对所述相似度大于或等于所述指定阈值的进行比较的待关联金融数据进行筛选;将符合所述模型的要求的进行比较的待关联金融数据确定为具有相同 ...
【技术保护点】
1.一种面向异构数据的数据关联方法,其特征在于,包括:对至少两个待关联金融数据进行两两比对,以确定进行比对的待关联金融数据中是否存在相同的属性;将具有相同属性的待关联金融数据进行关联。
【技术特征摘要】
1.一种面向异构数据的数据关联方法,其特征在于,包括:对至少两个待关联金融数据进行两两比对,以确定进行比对的待关联金融数据中是否存在相同的属性;将具有相同属性的待关联金融数据进行关联。2.如权利要求1所述的方法,其特征在于,对至少两个待关联金融数据进行两两比对,以确定进行比对的待关联金融数据中是否存在相同的属性包括:确定进行比对的待关联金融数据中的属性的语义和语法的相似度;判断所述相似度是否大于指定阈值;当所述相似度大于或等于所述指定阈值时,确定进行比对的待关联金融数据中存在相同的属性。3.如权利要求2所述的方法,其特征在于,当所述相似度小于所述指定阈值时,确定进行比对的待关联金融数据中不存在相同的属性。4.如权利要求2所述的方法,其特征在于,在对至少两个待关联金融数据进行两两比对之后,在将具有相同属性的待关联金融数据进行关联之前,所述方法还包括:利用度量学习得到的模型,对所述相似度大于或等于所述指定阈值的进行比较的待关联金融数据进行筛选;将符合所述模型的要求的进行比较的待关联金融数据确定为具有相同属性的待关联金融数据。5.如权利要求1所述的方法,其特征在于,在将具有相同属性的待关联金融数据进行关联之后,所述方法还包括:对具有相同属性的待关联金融数据进行合并。6.一种面向异构数据的数据关联装置,其特征在于,包括:比...
【专利技术属性】
技术研发人员:郑博,叶天生,梁栋,王宏志,
申请(专利权)人:北京松鼠山科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。