一种专利文本可授权性预测方法及装置制造方法及图纸

技术编号：31571637 阅读：15 留言：0更新日期：2021-12-25 11:11

本申请提供了一种专利文本可授权性预测方法及装置，属于自然语言处理中的文本匹配技术，目的是为了对撰写的专利申请文件是否符合专利法第26条进行初步预测。所述方法包括：利用4头注意力的transformer编码器对待预测专利文本、授权专利文本、以及未授权专利文本进行向量化编码，分别得到q[1:m]、d1[1:n]、和d2[1:n]；对q[1:m]分别与d1[1:n]和d2[1:n]做余弦计算，得到余弦得分矩阵M；利用k个RBF

全部详细技术资料下载

【技术实现步骤摘要】
一种专利文本可授权性预测方法及装置

[0001]本申请涉及自然语言处理中的文本匹配技术。

技术介绍

[0002]专利不仅是一种重要的财产权和无形资产，而且是企业的一种重要的竞争资源，专利发展水平更是成为衡量一个地区综合实力、发展能力和核心竞争力的战略性标志。
[0003]专利申请文件的撰写质量直接影响专利的授权前景，对撰写好的申请文件，尤其是权利要求书和说明书进行可授权性的初步预测是十分必要的。

技术实现思路

[0004]本申请的目的是为了满足现有技术的发展需求，提供一种专利文本可授权性预测方法及装置。
[0005]本申请的一种专利文本可授权性预测方法包括：
[0006]利用4头注意力的transformer编码器对所述待预测专利文本、所述授权专利文本、以及所述未授权专利文本进行向量化编码，得到所述待预测专利文本的文本向量q[1:m]、所述授权专利文本的文本向量d1[1:n]、以及所述未授权专利文本的文本向量d2[1:n]，其中，m表示向量q[1:m]的维度，n表示向量d1[1:n]和d2[1:n]的维度；
[0007]对所述q[1:m]分别与d1[1:n]和d2[1:n]做余弦计算，得到余弦得分矩阵M；
[0008]利用k个RBF
‑
kernel来转换余弦得分矩阵M，得到矩阵K1至K
k
，每个kernel集中于一个以μ
k
为中心的相似度分布中，并且集中范围由σ决定：
[0009][0010]对于第p...

【技术保护点】

【技术特征摘要】
1.一种专利文本可授权性预测方法，其特征在于，包括：利用4头注意力的transformer编码器对所述待预测专利文本、所述授权专利文本、以及所述未授权专利文本进行向量化编码，得到所述待预测专利文本的文本向量q[1:m]、所述授权专利文本的文本向量d1[1:n]、以及所述未授权专利文本的文本向量d2[1:n]，其中，m表示向量q[1:m]的维度，n表示向量d1[1:n]和d2[1:n]的维度；对所述q[1:m]分别与d1[1:n]和d2[1:n]做余弦计算，得到余弦得分矩阵M；利用k个RBF
‑
kernel来转换余弦得分矩阵M，得到矩阵K1至K
k
，每个kernel集中于一个以μ
k
为中心的相似度分布中，并且集中范围由σ决定：对于第p个kernel，p＝1,2,
…
,k，计算矩阵K
p
：对于所述授权专利文本和所述未授权专利文本，分别将所有kernel得到的结果拼接并进行线性映射，得到预测授权率和预测不授权率。2.根据权利要求1所述的方法，其特征在于，在所述利用4头注意力的transformer编码器对所述待预测专利文本、所述授权专利文本、以及所述未授权专利文本进行向量化编码之前，所述方法还包括：对所述待预测专利文本、所述授权专利文本、以及所述未授权专利文本进行分词，并将分词后得到的单词转换为词向量，将所述词向量作为所述双层transformer编码器的输入。3.根据权利要求1或2所述的方法，其特征在于，所述待预测专利文本、所述授权专利文本、以及所述未授权专利文本设定为相同长度。4.根据权利要求1所述的方法，其特征在于，所述授权专利文本和所述未授权专利文本的获取方法包括：对所述待预测专利文本进行向量化编码；以所述待预测专利文本为作查询，利用LambdaRank对数据库中的所有法律状态为授权的专利文档、所有因不符合专利法第26条而未授权的专利文本进行评分；选取排序靠前的授权专利文本和未授权专利文本。5.根据权利要求1所述的方法，其特征在于，所述transformer编码器为4头注意力的双层transformer编码器。6.一...

【专利技术属性】
技术研发人员：刘悦，杨沐昀，张明明，朱聪慧，赵增琴，曹海龙，赵铁军，徐冰，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人