一种语言模型的预测方法、装置、设备及介质制造方法及图纸

技术编号：42665332 阅读：30 留言：0更新日期：2024-09-10 12:21

本发明专利技术涉及人工智能技术领域，尤其涉及一种语言模型的预测方法、装置、设备及介质。根据N个待预测文本的文本长度与语言模型的窗口长度，以得到组合文本的数量最少为目标，对N个待预测文本进行组合得到M个组合文本，计算每个组合文本对应的掩码方案，针对任一组合文本，将组合文本以及组合文本对应的掩码方案输入至预设语言模型，输出组合文本对应的预测结果，根据每个组合文本对应的预测结果，确定N个待预测文本的预测结果。在对语言模型进行预测过程中，基于语言模型的输入窗口大小，将待预测文本组合成对应的组合文本，在每次输入时，输入对应的组合文本，减少输入次数，从而提高语言模型的预测效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，尤其涉及一种语言模型的预测方法、装置、设备及介质。

技术介绍

1、语言模型是自然语言处理中的重要组成部分，其核心任务是预测给定上下文中下一个词的概率分布。简单来说，语言模型能够判断一个句子是否符合语法规范，并给出其出现的概率。当使用语言模型对多个短文本进行预测时，对语言模型的输入为单个文本，文本较短的情况下，不能充分利用语言模型的上下文窗口，使语言模型的预测效率较低，因此，在使用语言模型对多个短文本进行预测过程中，如何提高语言模型的预测效率成为亟需解决的问题。

技术实现思路

1、有鉴于此，本专利技术实施例提供了一种语言模型的预测方法、装置、设备及介质，以解决在语言模型对多个短文本进行预测过程中，预测效率较低的问题。

2、第一方面，本专利技术实施例提供一种语言模型的预测方法，所述预测方法包括：

3、获取预设语言模型、所述预设语言模型的窗口长度以及n个待预测文本，n为大于零的整数；

4、根据所述n个待预测文本的文本长度与所述窗口长度，以得到组合文本的数量最少为目标，对所述n个待预测文本进行组合得到m个组合文本，其中，每个组合文本的文本长度小于所述窗口长度，m为大于零的整数，且m不大于n；

5、计算每个组合文本对应的掩码方案；

6、针对任一组合文本，将所述组合文本以及所述组合文本对应的掩码方案输入至所述预设语言模型，输出所述组合文本对应的预测结果，根据每个组合文本对应的预测结果，确定所述n个待预测文本的预测结果。

7、第二方面，本专利技术实施例提供一种语言模型的预测装置，所述预测装置包括：

8、获取模块，用于获取预设语言模型、所述预设语言模型的窗口长度以及n个待预测文本，n为大于零的整数；

9、组合模块，用于根据所述n个待预测文本的文本长度与所述窗口长度，以得到组合文本的数量最少为目标，对所述n个待预测文本进行组合得到m个组合文本，其中，每个组合文本的文本长度小于所述窗口长度，m为大于零的整数，且m不大于n；

10、第一计算模块，用于计算每个组合文本对应的掩码方案；

11、第一预测模块，用于针对任一组合文本，将所述组合文本以及所述组合文本对应的掩码方案输入至所述预设语言模型，输出所述组合文本对应的预测结果，根据每个组合文本对应的预测结果，确定所述n个待预测文本的预测结果。

12、第三方面，本专利技术实施例提供一种计算机设备，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的预测方法。

13、第四方面，本专利技术实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的预测方法。

14、本专利技术与现有技术相比存在的有益效果是：

15、获取预设语言模型、预设语言模型的窗口长度以及n个待预测文本，n为大于零的整数，根据n个待预测文本的文本长度与窗口长度，以得到组合文本的数量最少为目标，对n个待预测文本进行组合得到m个组合文本，其中，每个组合文本的文本长度小于窗口长度，m为大于零的整数，且m不大于n，计算每个组合文本对应的掩码方案，针对任一组合文本，将组合文本以及组合文本对应的掩码方案输入至预设语言模型，输出组合文本对应的预测结果，根据每个组合文本对应的预测结果，确定n个待预测文本的预测结果。本申请中，在对语言模型进行预测过程中，基于语言模型的输入窗口大小，将待预测文本组合成对应的组合文本，在每次输入时，输入对应的组合文本，减少输入次数，从而提高语言模型的预测效率。

本文档来自技高网...

【技术保护点】

1.一种语言模型的预测方法，其特征在于，所述预测方法包括：

2.如权利要求1所述的预测方法，其特征在于，所述根据所述N个待预测文本的文本长度与所述窗口长度，以得到组合文本的数量最少为目标，对所述N个待预测文本进行组合得到M个组合文本，包括：

3.如权利要求1所述的预测方法，其特征在于，所述计算每个组合文本对应的掩码方案，包括：

4.如权利要求1所述的预测方法，其特征在于，所述计算每个组合文本对应的掩码方案之后，还包括：

5.如权利要求4所述的预测方法，其特征在于，所述计算每个组合文本对应的位置编码方案，包括：

6.如权利要求1所述的预测方法，其特征在于，所述根据每个组合文本对应的预测结果，确定所述N个待预测文本的预测结果之后，还包括：

7.一种语言模型的预测装置，其特征在于，所述预测装置包括：

8.如权利要求7所述的语言模型的预测装置，其特征在于，所述预测装置还包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的预测方法。

...

【技术特征摘要】

1.一种语言模型的预测方法，其特征在于，所述预测方法包括：

2.如权利要求1所述的预测方法，其特征在于，所述根据所述n个待预测文本的文本长度与所述窗口长度，以得到组合文本的数量最少为目标，对所述n个待预测文本进行组合得到m个组合文本，包括：

3.如权利要求1所述的预测方法，其特征在于，所述计算每个组合文本对应的掩码方案，包括：

4.如权利要求1所述的预测方法，其特征在于，所述计算每个组合文本对应的掩码方案之后，还包括：

5.如权利要求4所述的预测方法，其特征在于，所述计算每个组合文本对应的位置编码方案，包括：

6.如权利要求1所述的预测方法，其特征在于...

【专利技术属性】
技术研发人员：李宏彬，余晓填，肖嵘，
申请(专利权)人：深圳云天励飞技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人