一种基于机器学习的文本信息识别提取方法技术

技术编号:21060940 阅读:52 留言:0更新日期:2019-05-08 07:23
本发明专利技术公开了一种基于机器学习的文本信息识别提取方法,具体包括连接数据库、文本识别提取、建立模型、筛选结果等步骤。本发明专利技术的有益效果是,有效提高了文本信息的获取效率,也提升了使用者操作的流畅度。

A Text Information Recognition and Extraction Method Based on Machine Learning

【技术实现步骤摘要】
一种基于机器学习的文本信息识别提取方法
本专利技术涉及文本提取领域,特别是一种基于机器学习的文本信息识别提取方法。
技术介绍
在一些图片上有时会存在一些文字信息,这些文字信息有时包含一些特殊字符,不方便进行打字,可以通过扫描器进行自动识别,常见的文本信息识别提取方法一般都是将扫描器贴在图片上进行扫描,但文字的大小不一,并且所要提取的文字信息也不是很连贯,提取困难,在提取完毕后需要对其进行检索,但检索的结果种类繁多,不便于进行查找。
技术实现思路
本专利技术的目的是为了解决上述问题,设计了一种基于机器学习的文本信息识别提取方法。实现上述目的本专利技术的技术方案为,一种基于机器学习的文本信息识别提取方法,具体包括如下步骤:步骤一、连接数据库:在移动终端上下载对应的端口,利用端口并通过无线网络与服务器终端进行连接,服务器终端内建立相应的数据库;步骤二、文本识别提取:将照片、纸张、手机内图片上的文本进行识别提取时,将其放置在桌面上,使用白纸将文本上除文字的部分进行遮挡,使用两个弹性带将其固定,将升降架放置在文本上方,将文字扫描摄像头下端由升降架上的方形开口伸出,将文字扫描摄像头对准文字部分,移动文字扫描摄像头并按压开关进行扫描,通过蓝牙信号将扫描出来的文字发送到移动终端中,进行识别;步骤三、建立模型:移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上,由服务终端上的智能程序对这些信息进行分类整理,并通过机械学习方法建立不同的模型,从而模拟使用者的搜索习惯,当使用者再次搜索某些信息时,可优化其搜索目标,提高使用者的搜索效率;步骤四、筛选结果:步骤二中将文字识别完毕后,智能系统可根据关键字信息和模拟处使用者的使用习惯自动筛选,将使用者所需要的信息进行显示,由使用者将所需要的搜索结果打开,并将使用者的使用历史进行记录,并再次上传,不断进行优化。所述步骤二中的照片或纸张上的文字过大时,可由手机将其拍成图片,将其缩小后再次进行扫描。所述步骤二中的升降架上表面两侧设有滑道,滑道位于方形开口两侧,文字扫描摄像头下端两侧设有连接轴,连接轴末端设有滑轮,滑轮下端位于滑道内。所述步骤二中的文字扫描摄像头下端为广口镜头,文字扫描摄像头前端下侧设有红外线激光灯,红外线激光灯激光发射端设有锥形出口,其倾斜角度与广口镜头的倾斜角度一致。所述步骤二中的开关位于文字扫描摄像头上端,其为按压式开关,按下后启动,松开后关闭。利用本专利技术的技术方案制作的基于机器学习的文本信息识别提取方法,可自由调整其扫描器的高度和角度,并将其进行移动,便于扫描文字,将扫描后的文字发送到检索机构后,可根据自己和其他人的检索记录,自动判断出使用者需要的信息,便于查找。附图说明图1是本专利技术所述基于机器学习的文本信息识别提取方法的流程示意图;图2是本专利技术所述文本识别提取的流程示意图;图3是本专利技术所述建立模型的流程示意图。具体实施方式下面结合附图对本专利技术进行具体描述,如图1-3所示。在本实施方案中,第一步、连接数据库:在移动终端上下载对应的端口,利用端口并通过无线网络与服务器终端进行连接,服务器终端内建立相应的数据库;第二步、文本识别提取:将需要提取的文本包括照片、纸张等物品放置在桌面上,使用者拿起白纸将文本上的其他无用的信息进行遮挡,使用弹性带将其进行固定,将升降架放置在文本上方,根据文字的大小进行高度的调整,使得方形开口对准需要的文字,将文字扫描摄像头扫描端由方形开口伸出,并使得滑轮落到滑道上,找好位置后,使用者按下开关,启动文字扫描摄像头和红外线激光灯,将激光灯照射在文字上,并移动文字扫描摄像头,通过激光灯可表明其扫描方向;第三步、筛选结果:智能系统可根据使用者的使用记录,模拟出使用者的搜索习惯,并自动筛选出使用者所需要的具体信息,并将这些信息进行整理后显示出来。实施案例一、在提取墙上或大海报上的文本信息时,使用智能手机对其进行拍照,然后在智能手机上将图片进行放大或缩小,使其文本信息不至于失真,将智能手机放置在桌面上,使用白纸将除文本信息之外的位置进行折挡,并将其固定,将升降架放置在智能手机上方,将文字扫描摄像头放在升降架上,打开红外线激光灯,调节升降架的高度,确定确定扫描范围,按住开关,移动文字扫描摄像头进行扫描,扫描完毕后,松开开关,通过蓝牙信号将文本信息发送到移动终端中,通过移动终端的智能搜索后,得出其想要的结果,并根据使用者选取的对应信息,再次将使用记录进行上传保存。实施案例二、在提取书籍上的文本信息时,由于其文字较小,可直接将文字扫描摄像头贴在书籍上,按住开关进行扫描,扫描完毕后,松开开关,通过蓝牙信号将文本信息发送到移动终端中,通过移动终端的智能搜索后,得出其想要的结果,并根据使用者选取的对应信息,再次将使用记录进行上传保存。实施案例三、在提取圆柱形物体上的文本信息时,先将升降架摆好,根据物体的直径调整高度,将文字扫描摄像头放置在升降架上固定,打开红外线激光灯,在圆柱形物体上文本信息外侧使用白纸包裹,将文本信息放置在文字扫描摄像头下方,根据红外线激光灯发射的光源进行定位,转动圆柱形物体,并按住开关,对其进行扫描,扫描完毕后,松开开关,通过蓝牙信号将文本信息发送到移动终端中,通过移动终端的智能搜索后,得出其想要的结果,并根据使用者选取的对应信息,再次将使用记录进行上传保存。上述技术方案仅体现了本专利技术技术方案的优选技术方案,本
的技术人员对其中某些部分所可能做出的一些变动均体现了本专利技术的原理,属于本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的文本信息识别提取方法,其特征在于,具体包括如下步骤:步骤一、连接数据库:在移动终端上下载对应的端口,利用端口并通过无线网络与服务器终端进行连接,服务器终端内建立相应的数据库;步骤二、文本识别提取:将照片、纸张、手机内图片上的文本进行识别提取时,将其放置在桌面上,使用白纸将文本上除文字的部分进行遮挡,使用两个弹性带将其固定,将升降架放置在文本上方,将文字扫描摄像头下端由升降架上的方形开口伸出,将文字扫描摄像头对准文字部分,移动文字扫描摄像头并按压开关进行扫描,通过蓝牙信号将扫描出来的文字发送到移动终端中,进行识别;步骤三、建立模型:移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上,由服务终端上的智能程序对这些信息进行分类整理,并通过机械学习方法建立不同的模型,从而模拟使用者的搜索习惯,当使用者再次搜索某些信息时,可优化其搜索目标,提高使用者的搜索效率;步骤四、筛选结果:步骤二中将文字识别完毕后,智能系统可根据关键字信息和模拟处使用者的使用习惯自动筛选,将使用者所需要的信息进行显示,由使用者将所需要的搜索结果打开,并将使用者的使用历史进行记录,并再次上传,不断进行优化。...

【技术特征摘要】
1.一种基于机器学习的文本信息识别提取方法,其特征在于,具体包括如下步骤:步骤一、连接数据库:在移动终端上下载对应的端口,利用端口并通过无线网络与服务器终端进行连接,服务器终端内建立相应的数据库;步骤二、文本识别提取:将照片、纸张、手机内图片上的文本进行识别提取时,将其放置在桌面上,使用白纸将文本上除文字的部分进行遮挡,使用两个弹性带将其固定,将升降架放置在文本上方,将文字扫描摄像头下端由升降架上的方形开口伸出,将文字扫描摄像头对准文字部分,移动文字扫描摄像头并按压开关进行扫描,通过蓝牙信号将扫描出来的文字发送到移动终端中,进行识别;步骤三、建立模型:移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上,由服务终端上的智能程序对这些信息进行分类整理,并通过机械学习方法建立不同的模型,从而模拟使用者的搜索习惯,当使用者再次搜索某些信息时,可优化其搜索目标,提高使用者的搜索效率;步骤四、筛选结果:步骤二中将文字识别完毕后,智能系统可根据关键字信息和模拟处使用者的使...

【专利技术属性】
技术研发人员:杨洋李双印
申请(专利权)人:深圳爱拼信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1