【技术实现步骤摘要】
一种基于笔记图像的笔记关键词识别方法、装置、设备
[0001]本申请涉及软件测试
,尤其涉及一种基于笔记图像的笔记关键词识别方法、装置、设备及笔记录入设备。
技术介绍
[0002]笔记记录是我们日常生活和工作中不可或缺的内容存储方法,伴随着经济社会的快速发展和教育方式的演变,出现了以图片为载体的笔记记录方式。
[0003]然而,目前大部分的笔记记录工具仅能够将图片格式的文本进行直接保存,或者通过相关插件“剪藏”各类网页图文原格式文件,而无法对图片格式的文本中的内容进行关键语义解析,使得文本阅读者需要耗费时间精力去阅读理解该类图片中的笔记内容。
技术实现思路
[0004]本申请提供了一种基于笔记图像的笔记关键词识别方法、装置、设备及存储介质,可以在减少网络模型的数据大小的同时,对笔记图片进行笔记内容的快速识别和关键语义的快速解析,提升对笔记图片进行笔记关键词识别的效率和准确性,本申请技术方案如下:
[0005]一方面,提供了一种基于笔记图像的笔记关键词识别方法,所述方法包括:
[0006]采集目标笔记信息的笔记图像;
[0007]将所述笔记图像输入笔记关键词识别网络中的文本识别网络进行文本识别,得到所述笔记图像对应的笔记识别文本;
[0008]将所述笔记识别文本输入所述笔记关键词识别网络中的关键语义提取网络进行关键语义提取,得到目标语义特征信息;
[0009]获取所述笔记识别文本对应的多个候选关键词;
[0010]将所述目标语义特征信息和所述 ...
【技术保护点】
【技术特征摘要】
1.一种基于笔记图像的笔记关键词识别方法,其特征在于,所述方法包括:采集目标笔记信息的笔记图像;将所述笔记图像输入笔记关键词识别网络中的文本识别网络进行文本识别,得到所述笔记图像对应的笔记识别文本;将所述笔记识别文本输入所述笔记关键词识别网络中的关键语义提取网络进行关键语义提取,得到目标语义特征信息;获取所述笔记识别文本对应的多个候选关键词;将所述目标语义特征信息和所述多个候选关键词输入所述笔记关键词识别网络中的关键词筛选网络进行关键词筛选,确定所述多个候选关键词中的笔记关键词;其中,所述文本识别网络和所述关键词筛选网络共用上下文语义识别层,所述上下文语义识别层用于对特征信息进行上下文语义识别。2.根据权利要求1所述的方法,其特征在于,所述关键语义提取网络包括:主题提取网络、高频语义挖掘网络和语义融合网络,所述将所述笔记识别文本输入所述笔记关键词识别网络中的关键语义提取网络进行关键语义提取,得到目标语义特征信息包括:将所述笔记识别文本输入所述主题提取网络进行主题提取,得到主题词特征信息;将所述笔记识别文本输入所述高频语义挖掘网络进行高频语义挖掘,得到高频语义特征信息;将所述主题词特征信息和所述高频语义特征信息输入所述语义融合网络进行语义融合,得到目标语义特征信息。3.根据权利要求2所述的方法,其特征在于,所述高频语义特征信息包括:至少一个高频关键词特征信息和所述至少一个高频关键词特征信息各自对应的语义支持度,所述语义融合网络包括:加权层和融合层,所述将所述主题词特征信息和所述高频语义特征信息输入所述语义融合网络进行语义融合,得到目标语义特征信息包括:将所述语义支持度和所述至少一个高频关键词特征信息输入所述加权层,基于所述语义支持度,对所述至少一个高频关键词特征信息进行加权处理,得到初始语义特征信息;将所述初始语义特征信息和所述主题词特征信息输入所述融合层进行语义融合,得到所述目标语义特征信息。4.根据权利要求1所述的方法,其特征在于,所述关键词筛选网络还包括:关联分析层、关键词筛选层,所述将所述目标语义特征信息和所述多个候选关键词输入所述笔记关键词识别网络中的关键词筛选网络进行关键词筛选,确定所述多个候选关键词中的笔记关键词包括:将所述目标语义特征信息输入所述上下文语义识别层进行上下文语义识别,得到上下文语义特征;将所述上下文语义特征和所述多个候选关键词输入所述关联分析层进行特征关联分析,得到每个候选关键词与所述上下文语义特征的特征关联信息;将所述特征关联信息输入所述关键词筛选层进行关键词筛选,确定所述笔记关键词。5.根据权利要求1所述的方法,其特征在于,所述文本识别网络还包括:图像特征提取层和文本转录层,所述将所述笔记图像输入笔记关键词识别网络中的文本识别网络进行文本识别,得到所述笔记图像对应的笔记识别文本包括:
将所述笔记图像输入所述图像特征提取层进行图像特征提取,得到图像特征序列;将所述图像特征序列输入所述上下文语义识别层进行上下文语义识别,得到所述图像特征序列对应的字符特征信息;将所述字符特征信息输入所述文本转录层进行特征转换,得到所述笔记识别文本。6.根据权利要求1至5任一所述的方法,其特征在于,所述采集目标笔记信息的笔记图像包括:采集所述目标笔记信息的待处理笔记图像;对所...
【专利技术属性】
技术研发人员:刘志煌,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。