The disclosure generally relates to data enrichment services for extracting, repairing, and enriching data sets, resulting in more accurate entity resolution and correlation for subsequent indexing and clustering. Data enrichment services can include visual recommendation engines and languages for large-scale data preparation, repair, and enrichment for performing heterogeneous data sets. This allows the user to select and see how the recommended enrichment (e.g., transformation and repair) affects the user's data and adjusts as needed. Data enrichment services can receive feedback from users through the user interface and can filter recommendations based on user feedback.
【技术实现步骤摘要】
【国外来华专利技术】对相关申请的交叉引用本申请要求于2015年9月24日提交的标题为“DECLARATIVELANGUAGEANDVISUALIZATIONSYSTEMFORRECOMMENDEDDATATRANSFORMATIONSANDREPAIRS”的美国非临时专利申请No.14/864,496的权益和优先权,该申请要求于2014年9月26日提交的标题为“DECLARATIVELANGUAGEANDVISUALIZATIONSYSTEMFORRECOMMENDEDDATATRANSFORMATIONSANDREPAIRS”的美国临时申请No.62/056,471的权益和优先权。本申请涉及以下申请:1)于2014年9月26日提交且标题为“METHODFORSEMANTICENTITYEXTRACTIONBASEDONGRAPHMATCHINGWITHANEXTERNALKNOWLEDGEBASEANDSIMILARITYRANKINGOFDATASETMETADATAFORSEMANTICINDEXING,SEARCH,ANDRETRIEVAL”的美国临时申请No.62/056,468;2)于2014年9月26日提交且标题为“DYNAMICVISUALPROFILINGANDVISUALIZATIOOFHIGHVOLUMEDATASETSANDREAL-TIMESMARTSAMPLINGANDSTATISTICALPROFILINGOFEXTREMELYLARGEDATASETS”的美国临时申请No.62/056,474;3)于2014年9月26日提交且标题为“AUTOMA ...
【技术保护点】
一种方法,包括:由计算机系统识别来自一个或多个数据源的数据中的模式;将模式与来自知识服务的实体信息进行匹配;基于实体信息为数据生成一个或多个变换脚本;生成与所述一个或多个变换脚本对应的一个或多个推荐;使得所述一个或多个推荐在用户界面中显示;接收基于所述一个或多个推荐的变换指令;基于变换指令变换数据;及基于变换指令将经变换的数据发布到一个或多个数据目标。
【技术特征摘要】
【国外来华专利技术】2014.09.26 US 62/056,471;2015.09.24 US 14/864,4961.一种方法,包括:由计算机系统识别来自一个或多个数据源的数据中的模式;将模式与来自知识服务的实体信息进行匹配;基于实体信息为数据生成一个或多个变换脚本;生成与所述一个或多个变换脚本对应的一个或多个推荐;使得所述一个或多个推荐在用户界面中显示;接收基于所述一个或多个推荐的变换指令;基于变换指令变换数据;及基于变换指令将经变换的数据发布到一个或多个数据目标。2.如权利要求1或权利要求2所述的方法,还包括:接收对所述一个或多个数据源中的至少一个数据源的至少一列数据的选择;及使得所述至少一列数据的数据简档被显示,其中数据简档指示在所述至少一列数据中识别出的多个模式、和与所述至少一列数据相关联的至少一个数据可视化。3.如权利要求1所述的方法,其中变换指令包括基于实体信息重命名至少一列数据的变换指令。4.如权利要求3所述的方法,还包括:接收将所述至少一列数据重命名为默认名称的另一变换指令。5.如前述权利要求中任一项所述的方法,其中变换指令包括基于实体信息重新格式化至少一列数据的变换指令。6.如权利要求5所述的方法,其中变换指令包括基于实体信息模糊化至少一列数据的另一变换指令。7.如前述权利要求中任一项所述的方法,其中变换指令包括基于实体信息添加从知识服务获得的一列或多列数据的丰富化指令。8.一种系统,包括:多个数据源;多个数据目标;及云计算基础设施系统,包括:一个或多个处理器,经至少一个通信网络通信耦合到所述多个数据源并通信耦合到所述多个数据目标;及存储器,耦合到所述一个或多个处理器,存储器存储指令以提供数据丰富化服务,其中所述指令在被所述一个或多个处理器执行时使得所述一个或多个处理器:从客户端设备接收数据丰富化请求;识别来自在数据丰富化请求中指定的至少一个数据源的数据中的模式;将模式与来自知识服务的实体信息匹配;基于实体信息为数据生成一个或多个变换脚本;生成与所述一个或多个变换脚本对应的一个或多个推荐;使得所述一个或多个推荐在客户端设备上的用户界面中显示;接收基于所述一个或多个推荐的变换指令;基于变换指令变换数据;及基于变换指令将经变换的数据发布到一个或多个数据目标。9.如权利要求8所述的系统,其中所述指令在由所述一个或多个处理器执行...
【专利技术属性】
技术研发人员:A·S·斯托贾诺维克,L·E·李瓦斯,P·戈伦,G·A·莫里,
申请(专利权)人:甲骨文国际公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。