System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智能识别,尤其是涉及一种文本识别方法及装置、非临时计算机可读存储介质和车辆。
技术介绍
1、随着人工智能的日益火爆,其应用已伴随着我们生活的方方面面,nlp(naturallanguage processing,自然语言处理)是人工智能的一个核心领域之一,广泛应用于情感分析、问答系统、自动摘要、机器翻译、语音识别、聊天机器人、市场预测、文本分类、拼写检查等领域。
2、对于文本识别,市面上有许多开源的断句模型,其识别方法是将一个长句通过算法模型分割成若个短句,然后再预测每个短句的意图信息,然而,经过语音转化后的待识别文本,若没有标点符号,使用上述方法进行断句时,文本识别效果差,无法进行准确的语音控制。
技术实现思路
1、本专利技术旨在至少解决现有技术中存在的技术问题之一。
2、为此,本专利技术的一个目的在于提出一种文本识别方法,该方法提高文本识别的准确性,便于根据上述文本识别结果进行精确语音控制。
3、为此,本专利技术的第二个目的在于提出一种文本识别装置。
4、为此,本专利技术的第三个目的在于提出一种非临时计算机可读存储介质。
5、为此,本专利技术的第四个目的在于提出一种车辆。
6、为了达到上述目的,本专利技术的第一方面的实施例提出了一种文本识别方法,方法包括:根据预设nlp模型,确定待识别文本中字符在预设标注类型的第一概率;根据预设cv网络模型及所述第一概率,确定所述待识别文本中字符在所述预设标注
7、根据本专利技术实施例的文本识别方法,通过将预设nlp模型和预设cv网络模型联合使用,分别确定待识别文本中字符在预设标注类型中第一概率及第二概率,并根据第一概率和第二概率输出目标标注信息,基于目标标注信息对待识别文本进行语句切分,无需依据标点符号进行语句切分,从而提高待识别文本断句的准确性,提高文本识别的准确性,便于根据上述文本识别结果进行精确语音控制。
8、在一些实施例中,根据预设nlp模型,确定待识别文本中字符在预设标注类型的第一概率,包括:根据预设bert模型得到多维特征向量;将所述多维特征向量输入第一分类器确定所述待识别文本中字符在预设标注类型的第一子概率;将所述多维特征向量输入第二分类器确定所述待识别文本中字符在预设标注类型的第二子概率;将所述第一子概率和所述第二子概率确定为所述第一概率。
9、在一些实施例中,所述第一分类器为crf分类器,所述第二分类器为softmax分类器。
10、在一些实施例中,根据预设bert模型得到多维特征向量,包括:确定所述待识别文本中字符的数字序列;将所述数字序列输入所述预设bert模型,得到所述多维特征向量。
11、在一些实施例中,将所述第一子概率和所述第二子概率确定为所述第一概率,包括:对所述第一子概率和所述第二子概率进行概率拼接,确定所述第一概率。
12、在一些实施例中,根据预设cv网络模型及所述第一概率,确定所述待识别文本中字符在所述预设标注类型的第二概率,包括:根据所述第一概率及预设函数确定拼接特征向量;对所述拼接特征向量进行正则化处理,确定处于预设像素范围的像素特征向量;根据所述像素特征向量及所述预设cv网络模型,确定所述待识别文本中字符在所述预设标注类型的第二概率。
13、在一些实施例中,所述述预设cv网络模型为预设cnn模型,所述根据所述像素特征向量及所述预设cv网络模型,确定所述待识别文本中字符在所述预设标注类型的第二概率,包括:将所述像素特征向量输入所述预设cnn模型,经预设卷积核处理得到所述像素特征向量对应的字符特征向量;将所述字符特征向量输入第三分类器,确定所述待识别文本中字符在所述预设标注类型的第二概率。
14、在一些实施例中,根据所述第一概率以及所述第二概率输出目标标注信息,包括:计算所述第一子概率、所述第二子概率及所述第二概率的方差;将所述方差输入第四分类器得到所述待识别文本中字符在所述预设标注类型的字符类型概率,并将所述字符类型概率最大的字符类型作为所述字符的目标标注信息。
15、在一些实施例中,根据所述目标标注信息对所述待识别文本进行断句识别,包括:确定所述目标标注信息中的起始标注字符及结束标注字符;根据所述起始标注字符及结束标注字符切分所述待识别文本;根据切分后的所述待识别文本进行断句识别。
16、为了达到上述目的,本专利技术的第二方面的实施例提出了一种文本识别装置,文本识别装置包括:第一确定模块,用于根据预设nlp模型,确定待识别文本中字符在预设标注类型中的第一概率;第二确定模块,用于根据预设cv网络模型及所述第一概率,确定所述待识别文本中字符在所述预设标注类型的第二概率;输出模块,用于根据所述第一概率以及所述第二概率输出目标标注信息;识别模块,用于根据所述目标标注信息对所述待识别文本进行断句识别。
17、根据本专利技术实施例的文本识别装置,通过将预设nlp模型和预设cv网络模型联合使用,分别确定待识别文本中字符在预设标注类型中第一概率及第二概率,并根据第一概率和第二概率输出目标标注信息,基于目标标注信息对待识别文本进行语句切分,无需依据标点符号进行语句切分,从而提高待识别文本断句的准确性,提高文本识别的准确性,便于根据上述文本识别结果进行精确语音控制。
18、为了达到上述目的,本专利技术的第三方面的实施例提出了一种非临时计算机可读存储介质,所述非临时性计算机可读存储介质上存储有文本识别程序,所述文本识别程序被处理器执行时实现如上述实施例所述的文本识别方法。
19、为了达到上述目的,本专利技术的第四方面的实施例提出了一种车辆,包括上述实施例所述的文本识别装置。
20、根据本专利技术实施例的车辆,通过将预设nlp模型和预设cv网络模型联合使用,分别确定待识别文本中字符在预设标注类型中第一概率及第二概率,并根据第一概率和第二概率输出目标标注信息,基于目标标注信息对待识别文本进行语句切分,无需依据标点符号进行语句切分,从而提高待识别文本断句的准确性,提高文本识别的准确性,便于根据上述文本识别结果进行精确语音控制。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
本文档来自技高网...【技术保护点】
1.一种文本识别方法,其特征在于,包括:
2.根据权利要求1所述的文本识别方法,其特征在于,根据预设NLP模型,确定待识别文本中字符在预设标注类型的第一概率,包括:
3.根据权利要求2所述的文本识别方法,其特征在于,
4.根据权利要求2所述的文本识别方法,其特征在于,根据预设Bert模型得到多维特征向量,包括:
5.根据权利要求2所述的文本识别方法,其特征在于,将所述第一子概率和所述第二子概率确定为所述第一概率,包括:
6.根据权利要求1所述的文本识别方法,其特征在于,根据预设CV网络模型及所述第一概率,确定所述待识别文本中字符在所述预设标注类型的第二概率,包括:
7.根据权利要求6所述的文本识别方法,其特征在于,所述述预设CV网络模型为预设CNN模型,所述根据所述像素特征向量及所述预设CV网络模型,确定所述待识别文本中字符在所述预设标注类型的第二概率,包括:
8.根据权利要求2所述的文本识别方法,其特征在于,根据所述第一概率以及所述第二概率输出目标标注信息,包括:
9.根据权利要求1
10.一种文本识别装置,其特征在于,包括:
11.一种非临时计算机可读存储介质,其特征在于,所述非临时性计算机可读存储介质上存储有文本识别程序,所述文本识别程序被处理器执行时实现如权利要求1-9所述的文本识别方法。
12.一种车辆,其特征在于,包括:如权利要求10所述的文本识别装置。
...【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
2.根据权利要求1所述的文本识别方法,其特征在于,根据预设nlp模型,确定待识别文本中字符在预设标注类型的第一概率,包括:
3.根据权利要求2所述的文本识别方法,其特征在于,
4.根据权利要求2所述的文本识别方法,其特征在于,根据预设bert模型得到多维特征向量,包括:
5.根据权利要求2所述的文本识别方法,其特征在于,将所述第一子概率和所述第二子概率确定为所述第一概率,包括:
6.根据权利要求1所述的文本识别方法,其特征在于,根据预设cv网络模型及所述第一概率,确定所述待识别文本中字符在所述预设标注类型的第二概率,包括:
7.根据权利要求6所述的文本识别方法,其特征在于,所述述预...
【专利技术属性】
技术研发人员:叶心癸,杨冬生,申众,刘柯,张又亮,
申请(专利权)人:比亚迪股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。