基于代理的系统的自动创建的系统和方法技术方案

技术编号:7138949 阅读:223 留言:0更新日期:2012-04-11 18:40
基于代理的系统可以由用户或第三方过程提供的规范而自动地生成。代理生成器将规范映射到将由基于代理的系统执行的一个或多个任务识别为典范概念的典范模型。代理生成器可以使用典范模型,生成一个或多个候选代理。候选代理可以包括一个或多个互连数据转换,其可以包括数据访问转换、预处理转换、机器学习转换和/或结构转换。代理生成器迭代地修改基于代理的系统,直到满足终止标准为止。终止标准可以提供选择机制,由此可以评价多个候选代理的性能。使用尤其是基于代理的系统的性能,可以选择最优代理。

【技术实现步骤摘要】
【国外来华专利技术】
本公开内容涉及用于自动地生成被配置成执行特定任务的基于代理的系统的系 统和方法。附图说明从参考附图进行的优选实施例的下述详细描述,另外的方面和优点将是显而易见 的,其中图IA是用于生成基于代理的系统的系统的一个实施例的框图;图IB是计算设备的框图;图2是包括多个转换(transform)和转换变形的数据结构的一个实施例的图;图3是代理生成器的一个实施例的数据流图;以及图4是用于自动地生成基于代理的系统的方法的一个实施例的流程图。具体实施例方式代理或基于代理的系统可用来为用户执行任务,诸如数据处理、数据挖掘等等。如 在此所使用的,“代理”或“基于代理的”系统可以是指被配置成执行数据处理任务的软件和 /或硬件组件。同样地,代理可以包括但不限于专家系统、语义智能系统、机器学习系统、 数据挖掘系统、预测分析系统等等。在一个或多个转换上可以包括代理。如在此所使用的,转换可以指与数据采集、数 据处理、数据流(例如转换间的数据流)、数据分析等等有关的任何任务。因此,转换可以包 括但不限于数据采集、数据获取、数据融合、数据清洗、数据格式化、数据挖掘、机器学习、 模式匹配、结果格式化等等。开发基于代理的系统的过程可以包括选择、配置,和/或将各种转换组成适用于 执行特定任务的一个或多个代理。一旦创建了(例如转换选择、配置和/或组合)基于代 理的系统,可以测试和/或改进该系统。测试可以包括为基于代理的系统提供一个或多个 数据集、评价由该系统响应于数据集而产生的结果,以及相应地修改该系统。数据集可以包 括存在已知“答案”或所需结果的测试数据集。替选地,或者另外地,数据集可以包括“现实 世界”数据。在一些实施例中,测试可以是迭代的;在每一迭代后,可以比较由基于代理的 系统的不同变形产生的结果来识别该系统的“最优执行”模型。如上所示,开发基于代理的系统可能是单调且耗时的,以及可能要求超过典型 用户的技能。实际上,在许多情形下,开发基于代理的系统可能要求一个或多个“领域专 家”(具有选择、组合、配置和/或改进包括基于代理的系统的转换所需的专业技能的人) 的服务。可以由典型用户(例如非专家用户)使用在此公开的系统和方法来自动地 生成基于代理的系统。在一个实施例中,可以提供代理生成器(例如“元代理”),其能 自主地生成基于代理的系统。可以将代理生成器配置成从用户接收“代理规范(agentspecification)”,其可以定义由该系统解决的问题和/或数据源。可以通过将在规范中定 义的任务映射到本体内的概念中,确定规范的典范模型。典范模型也可以包括在规范中识 别的数据源和本体间的映射。响应于导出规范的典范模型,可以将代理生成器配置成从转换集合选择一个或多 个转换来形成基于代理的系统。可以迭代地评价和改进包括基于代理的系统的转换,直到 确定“最优”系统为止。图IA是用于自动地生成基于代理的系统的系统100的一个实施例的框图。在一 些实施例中,系统100的一个或多个组件(例如元代理110、代理生成器130、模块120,122 和/或124)可以在诸如图IB中所示的计算设备101的一个或多个计算设备上实现和/或 与之结合实现。如图IB所示,计算设备101可以包括一个或多个处理器150、存储器模块 152、计算机可读存储介质154、人机接口 156、通信接口 158等等。处理器150可以包括一 个或多个通用处理器和/或一个或多个专用处理器(例如一个或多个专用集成电路(ASIC) 处理器)。存储器模块152可以包括易失和/或非易失存储器存储资源。计算机可读存储 介质巧4可以包括一个或多个盘、光存储、闪存模块等等。人机接口(HMI) 156可以允许用户 104与计算设备101交互,并且可以包括显示器、输入/输出设备(例如鼠标、键盘等等)等 等。通信接口 158可以包括被配置为将计算设备101可通信地耦合到一个或多个网络102 的一个或多个适配器。通信接口 158可以包括但不限于有线网络接口(例如以太网)、光 网络接口(例如光纤接口)、无线网络接口、公用交换电话网络(PSTN)接口(例如调制解调 器)、蜂窝网络接口(例如3G网络接口)等等。返回参考图1A,系统100包括元代理110,其可以通过网络102可通信地耦合到一 个或多个外部数据源160和/或用户104。网络102可以包括本领域公知的任何通信网络, 包括但不限于互联网协议(IP)网络(例如传输控制协议IP网络(TCP/IP)等等)、局域 网(LAN)、广域网(WAN)、虚拟专用网(VPN)、无线网络(例如IEEE802. lla_n,Bluetooth , EDGE, G3等等)、公用交换电话网(PSTN)、蜂窝电话网等等。用户104可以经各自的计算设备(未示出)可通信地耦合到元代理模块110,各自 的计算设备可以包括本领域公知的任何计算设备,包括但不限于个人计算设备(例如个人 计算机(PC)等等)、移动计算设备(例如膝上型计算机、超便携计算机等等)、智能电话、个 人数字助理等等。用户104可以经在用户计算设备上运行的诸如网络浏览器软件、远程通 信网(Telnet)门户等等的通用应用程序(未示出),与元代理模块110交互。替选地,或者 另外地,用户104可以经由元代理模块110提供的专用应用程序112,与元代理模块110交 互。如下文将更详细论述的,用户104可以向元代理模块110提交代理规范105,其可 以指出用户104要求哪种类型的基于代理的系统定义由该系统解决的问题(例如定义由 该系统执行的任务),识别执行该任务所需的数据源,和/或指明如何格式化不同的输出。 例如,规范105可以指出用户感兴趣识别在纽约证券交易所(NYSE)交易的、展示诸如“倒 锤”模式、“倒杯”模式等等特定趋势的股票。规范105可以进一步指出用户104想将搜索限 制到特定行业内的股票、具有特定市盈(PE)率的股票、具有特定市场资本的股票等等。在 另一例子中,规范105可以指出用户104希望找出与诸如医疗条件的特定主题有关的内容。 规范105可以将搜索空间限制到同行评审过,由具有特定证书(例如来自特定学校的证书,6在特定期刊出版等等)、具有特定类型的技能的研究人员编辑的内容。尽管在此提供规范105的两个非限制例子,本领域的技术人员将意识到规范105 能够与本领域已知的感兴趣的任何主题或领域关联,以及能够适用于包括与本领域已知的 感兴趣的特定主题和/或领域有关的任何限定词和/或参数。元代理模块110可以根据规范105构建基于代理的系统。在从用户104接收规 范105后,元代理模块110可以将规范105发送到代理生成器模块130,其可以被配置为从 规范105导出典范模型。如下将论述的,典范模型可以包括规范105和本体134(如下讨述 的)间的本体映射。使用典范模型,代理生成器130可以从转换集合中选择转换集,从其可 以生成基于代理的系统。在一些实施例中,可以迭代地修改包括基于代理的系统的转换,直 到确认最优基于代理的系统为止。元代理110可以包括本体134,其可以用来开发规范105的典范模型,识别与从不 同数据源160访问的数据161有关的概念,选择用于包含在基于代理的系统中的转换等等。 如在此所本文档来自技高网...

【技术保护点】
一种用于生成基于代理的系统的装置,包括:计算设备,包括处理器和计算机可读存储介质;代理生成器,被实现在计算机可读存储介质上并且在所述处理器上可操作,所述代理生成器被配置成接收代理规范;以及本体映射模块,被实现在所述计算机可读存储介质上并且在所述处理器上可操作,所述本体映射模块被配置成从所述代理规范导出典范模型;其中,所述代理生成器被配置成:使用所述典范模型来生成包括多个候选转换的基于代理的系统,迭代地修改包括所述基于代理的系统的候选转换直到满足终止标准为止,以及响应于满足所述终止标准从所述多个候选转换选择候选转换集。

【技术特征摘要】
【国外来华专利技术】US61/102,6652008年10月3日1.一种用于生成基于代理的系统的装置,包括计算设备,包括处理器和计算机可读存储介质;代理生成器,被实现在计算机可读存储介质上并且在所述处理器上可操作,所述代理 生成器被配置成接收代理规范;以及本体映射模块,被实现在所述计算机可读存储介质上并且在所述处理器上可操作,所 述本体映射模块被配置成从所述代理规范导出典范模型;其中,所述代理生成器被配置成使用所述典范模型来生成包括多个候选转换的基于 代理的系统,迭代地修改包括所述基于代理的系统的候选转换直到满足终止标准为止,以 及响应于满足所述终止标准从所述多个候选转换选择候选转换集。2.如权利要求1所述的系统,进一步包括本体,所述本体包括多个互连的概念,其中, 所述典范模型包括在所述代理规范和所述本体间的本体映射。3.如权利要求1所述的系统,其中,所述多个候选转换包括被配置成从网络可访问数 据源获取数据的数据采集转换。4.如权利要求3所述的系统,其中,所述多个候选转换包括被配置成对从所述网络可 访问数据源所访问的数据进行预处理的集成转换。5.如权利要求1所述的系统,其中,所述多个候选转换包括被配置成处理数据集来产 生结果的机器学习转换。6.如权利要求5所述的系统,其中,所述代理生成器被配置成使用所述结果来确定所 述多个候选转换的适宜度量。7.如权利要求6所述的系统,其中,所述数据集包括具有已知结果的测试数据集,以及 其中,所述多个候选转换的所述适宜度量基于所述已知结果与由所述多个候选转换产生的 结果的比较。8.如权利要求6所述的系统,其中,所述数据集包括从网络可访问数据源所访问的数 据,以及其中,所述多个候选转换的所述适宜度量基于由所述多个候选转换产生的结果与 由第三方提供的结果的比较。9.如权利要求8所述的系统,其中,所述第三方是人工操作者。10.如权利要求6所述的系统,其中,所述终止标准包括适宜度量阈值。11.如权利要求6所述的系统,其中,所述终止标准包括适宜度量改变阈值。12.如权利要求1所述的系统,其中,所述终止标准包括迭代限度。13.如权利要求1所述的系统,其中,所述候选转换被表示在网格数据结构内,以及其 中,修改所述候选转换包括遍历所述网格数据结构。14.如权利要求13所述的系统,其中,所述候选转换的每一个被表示为所述网格数据 结构中的行,其中,每一行包括多个列,每一列表示相应转换的变形,以及其中,修改所述候 选转换包括遍历网格列。15.如权利要求14所述的系统,其中,修改所述候选转换包括遍历行,以及其中,遍历 行以第二候选转换替换所述多个候选转换中的第一候选转换。16.一种计算机可读存储介质,包括被配置成使包括处理器和存储器的计算设备执行 方法的指令,所述方法包括从代理规范导出典范模型,所述典范模型包括在所述代理规范中指定的任务和本体内的一个或多个概念间的本体映射;使用所述典范模型从可用转换集选择多个候选转换,所述多个候选转换被配置成执行 在所述代理规范中指定的所述任务;以及迭代地修改所述多个候选转换直到满足终止标准为止;以及响应于满足所述终止标准,由所述多个候选转换中的选定多个候选转换构造基于代理 的系统。17.如权利要求16所述的计算机可读存储介质,其中,迭代修改所述...

【专利技术属性】
技术研发人员:小西奥多·C·坦纳
申请(专利权)人:益焦com有限公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1