基于行业语言模型生成自然语言推荐制造技术

技术编号:26428888 阅读:20 留言:0更新日期:2020-11-20 14:27
本发明专利技术提供了用于基于行业语言模型生成自然语言推荐的系统、方法和计算机可读介质。从第一计算设备接收包括多个自然语言输入单元的输入数据并将其传输到第二计算设备。第二计算设备可使用被训练为生成对应于能源勘探词汇的输出的预测模型来确定包括多个自然语言输出的输出。第二计算设备可向第一计算设备提供该输出以用于显示。

【技术实现步骤摘要】
【国外来华专利技术】基于行业语言模型生成自然语言推荐相关申请的交叉引用本申请根据35U.S.C.§119要求于2018年1月26日提交的名称为“GeneratingNaturalLanguageRecommendationsBasedonanIndustrialLanguageModel”的美国临时申请No.62/622,693的优先权,该临时申请据此全文以引用方式明确地并入本文。
技术介绍
自然语言包括人类用来交流关于话题、对象、任务或环境的字母、字词、句子、短语或它们的组合。领域专用的自然语言包括人类用于在特定领域或行业(诸如油气领域或能源勘探行业)的情境中描述主题、对象、任务或环境的自然语言字母、字词、句子、短语或它们的组合的子集。向领域专用的应用程序提供输入的用户可能对提供输入时可使用的领域专用的自然语言具有有限的知识。因此,应用程序可能提供相对于用户正尝试执行的特定输入或任务在情境上不相关的输出,但其可与所接收的输入弱相关。此类限制可能降低与应用程序交互的用户的知识传输、任务完成和通信质量。机器学习是人工智能的应用,其通过使用从数据迭代地学习模式而没有数据模式的明确指示的算法来自动化分析模型的开发。机器学习通常用于模式识别、计算机视觉、语言处理和光学字符识别,并且使得能够构建能够从数据准确地学习以预测模型输出的算法,从而作出数据驱动的预测或决策。机器学习可用于开发能够生成与特定行业或领域相关联的领域专用的自然语言的行业语言模型。
技术实现思路
在一个方面,提供了用于基于行业语言模型生成自然语言推荐的方法。在一个实施方案中,所述方法可包括接收提供给包括数据处理器的第一计算设备的输入。所述输入包括多个自然语言输入单元。所述方法还可包括将所述输入传输到包括数据处理器的第二计算设备。所述传输由所述第一计算设备通过网络执行。所述方法还可包括由所述第二计算设备确定输出。所述输出是使用所传输的输入和被训练为接收自然语言输入单元的预测模型来确定的,并且所述预测模型响应于所述接收而生成对应于能源勘探词汇的输出。所述输出包括被预测为对应于所述输入并且被包括在所述能源勘探词汇中的多个自然语言输出单元。所述方法还可包括由所述第二计算设备将所述输出传输到所述第一计算设备。所述传输使得所述第一计算设备提供所述输出以用于显示。还描述了存储指令的非暂态计算机程序产品(即,在物理上体现的计算机程序产品),所述指令当由一个或多个计算系统的一个或多个数据处理器执行时,使得至少一个数据处理器执行本文的操作。类似地,还描述了可包括一个或多个数据处理器和耦接到所述一个或多个数据处理器的存储器的计算机系统。所述存储器可暂时或永久地存储指令,所述指令使得至少一个处理器执行本文所述的操作中的一个或多个操作。此外,方法可由单个计算系统内的或分布在两个或更多个计算系统中的一个或多个数据处理器来实现。此类计算系统可经由一个或多个连接,包括网络(例如,互联网、无线广域网、局域网、广域网、有线网络等)上的连接,经由多个计算系统中的一个或多个之间的直接连接等来连接并且可交换数据和/或命令或其他指令等。附图说明根据以下结合附图的详细描述,将更容易理解这些和其他特征,其中:图1是示出用于基于行业语言模型生成自然语言推荐的示例性架构的框图;图2A至图2B示出了用于基于行业语言模型生成自然语言推荐的系统的示例性框图;图3是示出用于训练模型以生成自然语言推荐的架构的一个示例性实施方案的框图;图4是示出用于使用图1的客户端/服务器架构基于行业语言模型生成自然语言推荐的方法的一个示例性实施方案的流程图;并且图5是示出包括经过训练以在操作中生成自然语言推荐的行业语言模型的系统的架构的框图。应注意,附图不一定按比例绘制。附图仅旨在描绘本文所公开的主题的典型方面,因此不应视为限制本公开的范围。具体实施方式对于寻求确保书面和口头交流的组织而言,提供领域专用的自然语言的推荐可能是重要的目标,这些书面和口头交流包括可相对于正在执行的交流的性质以及组织操作所在的特定行业或领域在情境上准确的自然语言单元,诸如字词。在产品文档、培训和营销材料以及技术数据、应用程序输出和搜索结果中使用领域专用的字词或短语,可极大地增强材料或应用程序输出的质量和可解释性。在一些情况下,领域专用的语言可能是后续处理步骤所需的,或者作为领域专用的工作流程中能够临时交付的语言的一部分,除非用户提供适当的领域专用的语言,否则该领域专用的工作流程不能根据需要完成。然而,一些用户,尤其是在特定领域中可能具有有限经验的新手用户可能无法自己生成必要的领域专用的语言。类似地,领域专用的软件应用程序的新用户或非专家用户可能通常在向应用程序提供输入时缺乏可用的对领域专用的自然语言的认识或知识。领域专家通常使用在情境上与其工作所在的特定行业或领域相关的自然语言进行交流,并且可使用其已作为特定领域中的专家获得的领域专用的自然语言来提供应用程序输入。然而,非专家用户可能不知道领域专用的自然语言词汇的完整范围,并且可能提供包括不太适当的领域专用自然语言的应用程序输入,这可能导致错误的输出,低效的知识传输,并且可能需要额外的处理和/或计算资源,以便生成包括在情境上与应用程序输入相关的领域专用自然语言的输出。例如,与聊天机器人应用程序或自动推荐代理交互的用户可在提供缺乏足够领域专用的关键词的输入时,接收可与用户寻求获得知识的领域专用的任务或目标无关的输出或推荐。因此,用户可停止与该应用程序的交互,或者可在没有足够的领域专用知识的情况下执行领域专用的任务或目标。在油气或能源勘探领域中,领域专用语言的词汇可用于用户之间的交流或用于与计算设备的通信。用户可包括工程师、技术人员、地质学家、岩石物理学家和石化工程师。例如,可能需要用户将输入提供给用于确定操作设备的规范的领域专用搜索引擎。用户可提供旨在涉及领域专用的操作设备的字词或短语,但其可能缺少搜索引擎处理输入所必需的领域专用的语言。因此,搜索引擎可能生成不正确的输出或可能与操作设备无关的输出。此类不正确输出的后果可包括错误信息或不正确的信息,诸如可包括在产品文档中或传送到领域专用的工作流中的另一资源的一件操作设备的不正确规范。在一些情况下,错误信息或不准确的行业专用数据可具有最少的下游效应,诸如产品手册中的打字错误。在其他情况下,不正确或不太专业的行业信息可能产生灾难性结果,例如,在任务关键工作流中传送或以其他方式实现不正确的部件号或规格细节的情况。行业语言模型可被配置为与领域专用的软件应用程序进行互操作,使得在接收到对这些应用程序的自然语言输入时,这些输入可被传输到行业语言模型并被处理以确定自然语言输出,这些自然语言输出包括在领域专用的词汇(诸如与油气或能源勘探行业相关联的词汇)中找到的字词、句子和短语。行业语言模型可被进一步配置为响应于接收到自然语言输入,而嵌入新字词或缺失字词,对所接收的输入内的类别或主题进行分类,生成要包括在输出中的文本,并且在提供输出之前基于用户偏好对自然语言输出进行排序。因此本文档来自技高网...

【技术保护点】
1.一种方法,所述方法包括:/n接收提供给包括数据处理器的第一计算设备的输入,所述输入包括多个自然语言输入单元;/n将所述输入传输到包括数据处理器的第二计算设备,所述传输由所述第一计算设备通过网络执行;/n由所述第二计算设备确定输出,所述输出是使用所传输的输入和被训练为接收自然语言输入单元的预测模型来确定的,并且所述预测模型响应于所述接收而生成对应于能源勘探词汇的输出,所述输出包括被预测为对应于所述输入并且被包括在所述能源勘探词汇中的多个自然语言输出单元;以及/n由所述第二计算设备将所述输出传输到所述第一计算设备,所述传输使得所述第一计算设备提供所述输出以用于显示。/n

【技术特征摘要】
【国外来华专利技术】20180126 US 62/622,6931.一种方法,所述方法包括:
接收提供给包括数据处理器的第一计算设备的输入,所述输入包括多个自然语言输入单元;
将所述输入传输到包括数据处理器的第二计算设备,所述传输由所述第一计算设备通过网络执行;
由所述第二计算设备确定输出,所述输出是使用所传输的输入和被训练为接收自然语言输入单元的预测模型来确定的,并且所述预测模型响应于所述接收而生成对应于能源勘探词汇的输出,所述输出包括被预测为对应于所述输入并且被包括在所述能源勘探词汇中的多个自然语言输出单元;以及
由所述第二计算设备将所述输出传输到所述第一计算设备,所述传输使得所述第一计算设备提供所述输出以用于显示。


2.根据权利要求1所述的方法,还包括第二预测模型,所述第二预测模型被训练为基于第二输入确定第二输出,所述第二输出包括不同的多个自然语言输出单元。


3.根据权利要求1所述的方法,其中所述多个自然语言输入单元包括字词、字词的一部分、字符、字符序列、数字或数字序列。


4.根据权利要求1所述的方法,其中所述预测模型已被训练为基于在机器学习过程的训练阶段中接收自然语言输入单元作为到字词嵌入模型的训练输入数据来确定对应于所述能源勘探词汇的所述输入中的字词的分布,所述预测模型在所述机器学习过程的所述训练阶段中被训练。


5.根据权利要求1所述的方法,其中所述预测模型已被训练为基于在机器学习过程的训练阶段中接收自然语言输入单元作为到文本分类模型的训练输入数据来将所述输入分类到与所述能源勘探词汇相关联的一个或多个类别中,所述预测模型在所述机器学习过程的所述训练阶段中被训练。


6.根据权利要求1所述的方法,其中所述预测模型已被训练为接收所述输入,并且基于在机器学习过程的训练阶段中接收自然语言输入单元作为到文本生成模型的训练输入数据来自动生成作为包括所述能源勘探词汇中所包括的所述多个自然语言输出单元的短语和句子的输出,所述预测模型在所述机器学习过程的所述训练阶段中被训练。


7.根据权利要求6所述的方法,其中所述预测模型已被训练为在机器学习过程的训练阶段中使用一个或多个文本排序算法基于用户偏好对所述自动生成的输出进行排序,所述预测模型在所述机器学习过程的所述训练阶段中被训练。


8.根据权利要求1所述的方法,其中所述第一计算设备包括基于领域的自动建议和拼写校正界面,所述基于领域的自动建议和拼写校正界面被配置为接收所述输入并提供所述输出以用于显示,所述输出基于字词嵌入模型和语言模型来确定。


9.根据权利要求1所述的方法,其中所述第一计算设备包括情境感知推荐代理,所述情境感知推荐代理被配置为接收所述输入并提供所述输出以用于显示,所述输出基于一个或多个文本排序算法来确定。


10.根据权利要求1所述的方法,其中所述第一计算设备包括领域专用的语义搜索界面,所述领域专用的语义搜索界面被配置为接收所述输入并提供所述输出以用于显示,所述输出基于字词嵌入模型和语言模型来确定。


11.根据权利要求1所述的方法,其中所述第一计算设备包括基于内容的文本生成界面,所述基于内容的文本生成界面被配置为接收所述输入并提供所述输出以用于显示,所述输出基于文本生成模型来确定。


12.根据权利要求1所述的方法,其中所述输出包括一个或多个输出单元,所述一个或多个输出单元需要另外的输入以使得执行被配置在所述第一计算设备和/或所述第二计算设备上的能够执行的内容。


13.一种系统,所述系统包括:
第一计算设备,所述第一计算设备包括数据处理器并且被配置为接收和传输输入;和
第二计算设备,所述第二计算设备经由网络耦接到所述第一计算设备,所述第二计算设备包括处理器以及存储计算机可读指令和多个预测模型的存储器,所述处理器被配置为执行所述计算机可读指令,所述计算机可读指令在被执行时使得所述处理器执行操作,所述操作包括:
接收从所述第一计算设备传输的所述输入,所述输入包括多个自然...

【专利技术属性】
技术研发人员:朱璇阿伦·卡尔提·苏布拉曼尼亚赵海明郑杰旭
申请(专利权)人:威盖特技术美国有限合伙人公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1