一种基于机器学习的文本信息识别提取方法技术

技术编号：21060940 阅读：62 留言：0更新日期：2019-05-08 07:23

本发明专利技术公开了一种基于机器学习的文本信息识别提取方法，具体包括连接数据库、文本识别提取、建立模型、筛选结果等步骤。本发明专利技术的有益效果是，有效提高了文本信息的获取效率，也提升了使用者操作的流畅度。

A Text Information Recognition and Extraction Method Based on Machine Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的文本信息识别提取方法
本专利技术涉及文本提取领域，特别是一种基于机器学习的文本信息识别提取方法。
技术介绍
在一些图片上有时会存在一些文字信息，这些文字信息有时包含一些特殊字符，不方便进行打字，可以通过扫描器进行自动识别，常见的文本信息识别提取方法一般都是将扫描器贴在图片上进行扫描，但文字的大小不一，并且所要提取的文字信息也不是很连贯，提取困难，在提取完毕后需要对其进行检索，但检索的结果种类繁多，不便于进行查找。
技术实现思路
本专利技术的目的是为了解决上述问题，设计了一种基于机器学习的文本信息识别提取方法。实现上述目的本专利技术的技术方案为，一种基于机器学习的文本信息识别提取方法，具体包括如下步骤：步骤一、连接数据库：在移动终端上下载对应的端口，利用端口并通过无线网络与服务器终端进行连接，服务器终端内建立相应的数据库；步骤二、文本识别提取：将照片、纸张、手机内图片上的文本进行识别提取时，将其放置在桌面上，使用白纸将文本上除文字的部分进行遮挡，使用两个弹性带将其固定，将升降架放置在文本上方，将文字扫描摄像头下端由升降架上的方形开口伸出，将文字扫描摄像头对准文字部分，移动文字扫描摄像头并按压开关进行扫描，通过蓝牙信号将扫描出来的文字发送到移动终端中，进行识别；步骤三、建立模型：移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上，由服务终端上的智能程序对这些信息进行分类整理，并通过机械学习方法建立不同的模型，从而模拟使用者的搜索习惯，当使用者再次搜索某些信息时，可优化其搜索目标，提高使用者的搜索效率；步骤四、筛选结果：步...

【技术保护点】
1.一种基于机器学习的文本信息识别提取方法，其特征在于，具体包括如下步骤：步骤一、连接数据库：在移动终端上下载对应的端口，利用端口并通过无线网络与服务器终端进行连接，服务器终端内建立相应的数据库；步骤二、文本识别提取：将照片、纸张、手机内图片上的文本进行识别提取时，将其放置在桌面上，使用白纸将文本上除文字的部分进行遮挡，使用两个弹性带将其固定，将升降架放置在文本上方，将文字扫描摄像头下端由升降架上的方形开口伸出，将文字扫描摄像头对准文字部分，移动文字扫描摄像头并按压开关进行扫描，通过蓝牙信号将扫描出来的文字发送到移动终端中，进行识别；步骤三、建立模型：移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上，由服务终端上的智能程序对这些信息进行分类整理，并通过机械学习方法建立不同的模型，从而模拟使用者的搜索习惯，当使用者再次搜索某些信息时，可优化其搜索目标，提高使用者的搜索效率；步骤四、筛选结果：步骤二中将文字识别完毕后，智能系统可根据关键字信息和模拟处使用者的使用习惯自动筛选，将使用者所需要的信息进行显示，由使用者将所需要的搜索结果打开，并将使用者的使用历史进行记...

【技术特征摘要】
1.一种基于机器学习的文本信息识别提取方法，其特征在于，具体包括如下步骤：步骤一、连接数据库：在移动终端上下载对应的端口，利用端口并通过无线网络与服务器终端进行连接，服务器终端内建立相应的数据库；步骤二、文本识别提取：将照片、纸张、手机内图片上的文本进行识别提取时，将其放置在桌面上，使用白纸将文本上除文字的部分进行遮挡，使用两个弹性带将其固定，将升降架放置在文本上方，将文字扫描摄像头下端由升降架上的方形开口伸出，将文字扫描摄像头对准文字部分，移动文字扫描摄像头并按压开关进行扫描，通过蓝牙信号将扫描出来的文字发送到移动终端中，进行识别；步骤三、建立模型：移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上，由服务终端上的智能程序对这些信息进行分类整理，并通过机械学习方法建立不同的模型，从而模拟使用者的搜索习惯，当使用者再次搜索某些信息时，可优化其搜索目标，提高使用者的搜索效率；步骤四、筛选结果：步骤二中将文字识别完毕后，智能系统可根据关键字信息和模拟处使用者的使...

【专利技术属性】
技术研发人员：杨洋，李双印，
申请(专利权)人：深圳爱拼信息科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人