一种通过内容识别属地的方法技术

技术编号:38083122 阅读:8 留言:0更新日期:2023-07-06 08:49
本发明专利技术涉及通信技术领域,具体涉及通过内容识别属地的方法、系统、计算机设备及存储介质。该方法包括以下步骤:获取内容信息,所述内容信息为文本内容,所述内容信息包括通过将模糊图片内容转换为文本内容;将所述内容信息转化为字符数据;基于所述字符数据,提取字符数据中的地域特征数据;基于所述地域特征数据获取内容信息中出现的每个地域数据;对每个地域数据进行排序,获得所述内容信息对应的所属地域数据。本发明专利技术能够将内容信息中图片中的文字进行准确识别,能够很好的对属地进行辅助识别,提高识别的准确性。提高识别的准确性。提高识别的准确性。

【技术实现步骤摘要】
一种通过内容识别属地的方法


[0001]本专利技术涉及通信
,尤其涉及通过内容识别属地的方法。

技术介绍

[0002]通信技术,又称通信工程(也作信息工程、电信工程,旧称远距离通信工程、弱电工程)是电子工程的重要分支,同时也是其中一个基础学科。该学科关注的是通信过程中的信息传输和信号处理的原理和应用。通信工程研究的是,以电磁波、声波或光波的形式把信息通过电脉冲,从发送端(信源)传输到一个或多个接受端(信宿)。接受端能否正确辨认信息,取决于传输中的损耗功率高低。信号处理是通信工程中一个重要环节,其包括过滤,编码和解码等。专业课程包括计算机网络基础、电路基础、通信系统原理、交换技术、无线技术、计算机通信网、通信电子线路、数字电子技术、光纤通信等。
[0003]随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为信息主要载体之一,网络的传播特性使得海量的网络信息涌向用户。
[0004]但用户还是更关注发生在身边的事情,因此如何能够准确的识别网络信息中的地域信息,显得尤为重要,现有技术在属地识别过程单纯的考虑文字信息,导致识别不够准确。

技术实现思路

[0005]为了解决上述现有技术中存在的技术问题,本专利技术提供了一种通过内容识别属地的方法。
[0006]为实现上述目的,本专利技术实施例提供了如下的技术方案:第一方面,在本专利技术提供的一个实施例中,提供了通过内容识别属地的方法,该方法包括以下步骤:获取内容信息,所述内容信息为文本内容,所述内容信息包括通过将模糊图片内容转换为文本内容;将所述内容信息转化为字符数据;基于所述字符数据,提取字符数据中的地域特征数据;基于所述地域特征数据获取内容信息中出现的每个地域数据;对每个地域数据进行排序,获得所述内容信息对应的所属地域数据。
[0007]作为本专利技术的进一步方案,所述通过将模糊图片内容转换为文本内容,包括:S1011、基于SURF算法提取图片中待识别文字的关键点;S1012、计算文字类别数据库中每个类别的每个关键点与待识别文字所有关键点模糊匹配度的最大值,并将所述模糊匹配度的最大值作为该关键点的模糊匹配度;S1013、基于模糊匹配度,根据模糊推理实现文字识别。
[0008]作为本专利技术的进一步方案,所述SURF算法的训练过程中,包括:获取训练样本,提
取属于同一类所有训练样本的SURF描述字进行互配;计算训练样本中互配频次超过该类样本数的1/2的每个关键点的匹配率,建立文字类别数据库。
[0009]作为本专利技术的进一步方案,所述计算训练样本中互配频次超过该类样本数的1/2的每个关键点的匹配率,建立文字类别数据库,包括:计算关键点的SURF描述符的平均值,以及描述符与均值之间的最大欧氏距离;基于关键点的匹配率和SURF描述符、SURF描述符与均值之间的最大欧氏距离形成文字类别数据库。
[0010]作为本专利技术的进一步方案,所述深度神经网络模型的训练方法,包括如下步骤:获取样本数据,所述样本数据为文本格式的地域数据和干扰数据;对所述样本数据进行标记,获得结果数据集;基于所述样本数据对所述深度神经网络模型进行训练,并输出训练结果;将所述训练结果与结果数据集进行比对,获得比对结果,基于所述比对结果对所述深度神经网络模型进行参数调整,完成对深度神经网络模型的训练。
[0011]作为本专利技术的进一步方案,所述对每个地域数据进行排序,获得所述内容信息对应的所属地域数据;包括如下步骤:对所述地域数据进行统计,获取统计数据;对所述统计数据进行排序,获得排序数据;输出排序数据中概率和超过预设阈值的前顺位的地域数据。
[0012]作为本专利技术的进一步方案,所述预设阈值为50%。
[0013]第二方面,在本专利技术提供的又一个实施例中,提供了通过内容识别属地的系统,该系统包括:数据获取模块、数据转换模块和属地识别模块。
[0014]所述数据获取模块,用于获取内容信息,所述内容信息为文本内容,所述内容信息包括通过将模糊图片内容转换为文本内容;所述数据转换模块,用于将所述内容信息转化为字符数据;基于所述字符数据,提取字符数据中的地域特征数据;所述属地识别模块,用于基于所述地域特征数据获取内容信息中出现的每个地域数据;对每个地域数据进行排序,获得所述内容信息对应的所属地域数据。
[0015]第三方面,在本专利技术提供的又一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器加载并执行所述计算机程序时实现通过内容识别属地的方法的步骤。
[0016]第四方面,在本专利技术提供的再一个实施例中,提供了一种存储介质,存储有计算机程序,所述计算机程序被处理器加载并执行时实现所述通过内容识别属地的方法的步骤。
[0017]本专利技术提供的技术方案,具有如下有益效果:本专利技术提供的通过内容识别属地的方法,本专利技术获取内容信息,所述内容信息为文本内容,所述内容信息包括通过将模糊图片内容转换为文本内容;将所述内容信息转化为字符数据;基于所述字符数据,提取字符数据中的地域特征数据;基于所述地域特征数据获取内容信息中出现的每个地域数据;对每个地域数据进行排序,获得所述内容信息对应的所属地域数据;能够将内容信息中图片中的文字进行准确识别,能够很好的对属地进行
辅助识别,提高识别的准确性。
[0018]本专利技术的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0019]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0020]图1为本专利技术一个实施例的通过内容识别属地的方法的流程图。
[0021]图2为本专利技术一个实施例的通过内容识别属地的方法中步骤S10具体流程图。
[0022]图3为本专利技术一个实施例的通过内容识别属地的系统的结构框图。
[0023]图中:数据获取模块

100、数据转换模块

200、属地识别模块

300。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0026]应当理解,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通过内容识别属地的方法,其特征在于,该方法包括:获取内容信息,所述内容信息为文本内容,所述内容信息包括通过将模糊图片内容转换为文本内容;将所述内容信息转化为字符数据;基于所述字符数据,提取字符数据中的地域特征数据;基于所述地域特征数据获取内容信息中出现的每个地域数据;对每个地域数据进行排序,获得所述内容信息对应的所属地域数据。2.如权利要求1所述的通过内容识别属地的方法,其特征在于,所述通过将模糊图片内容转换为文本内容,包括:S1011、基于SURF算法提取图片中待识别文字的关键点;S1012、计算文字类别数据库中每个类别的每个关键点与待识别文字所有关键点模糊匹配度的最大值,并将所述模糊匹配度的最大值作为该关键点的模糊匹配度;S1013、基于模糊匹配度,根据模糊推理实现文字识别。3.如权利要求2所述的通过内容识别属地的方法,其特征在于,所述基于SURF算法提取图片中待识别文字的关键点,包括确定关键点的SURF描述符。4.如权利要求2所述的通过内容识别属地的方法,其特征在于,所述SURF算法的训练过程中,包括:获取训练样本,提取属于同一类所有训练样本的SURF描述字进行互配;计算训练样本中互配频次超过该类样本数的1/2的每个关键点的匹配率,建立文字类别数据库。5.如权利要求4所述的通过内容识别属地的方法,其特征在于,所述计算训练样本中互配频次超过该类样本数...

【专利技术属性】
技术研发人员:薛玲严江杰王一杰
申请(专利权)人:云目未来科技湖南有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1