当前位置: 首页 > 专利查询>罗杰仁专利>正文

一种将图片转换为语音的方法及装置制造方法及图纸

技术编号:14710724 阅读:106 留言:0更新日期:2017-02-26 11:28
本发明专利技术公开了一种将图片转换为语音的方法及装置,该装置的结构为:在壳体(1)的背面设有显示屏(2)和扬声器(4);壳体内设有主板;壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);壳体的正面设有摄像头(16)和补光灯;壳体上还设有与主板连接的位置检测装置。该装置易于实施,结构独特,功能丰富,特别适合盲人使用。

【技术实现步骤摘要】

本专利技术涉及一种将图片转换为语音的方法及装置
技术介绍
根据世界卫生组织提供的数据,中国是全世界盲人最多的国家,占全世界盲人口的18%。每年在中国约有45万人失明,2010年中国盲人(blind)824.8万,低视力(lowvision)6727.4万,视力残疾(visualimpairment)是两者的总和7551.2万。按照这个势头,目前的盲人,估计可能超过1300万,也就是,每一百个人里面,就有一个盲人。对于很多人来说,阅读和交流是件很简单的事情,然而,对于盲人来说,他们的阅读却要通过“听”与“触摸”来实现。社会对盲文读物出版给予大力支持,但是“书荒仍存”,有一个重要原因就是制作成本高、印刷效率远低于普通出版物。目前,出现了一些帮助盲人上网的读屏软件,一定程度上可以解决盲人上网的困难,但对于解决阅读纸质书籍、同时帮助盲人与正常人交流的技术或设备还是不够方便或低廉。因此,有必要设计一种新的将图片转换为语音的方法及装置。
技术实现思路
本专利技术所要解决的技术问题是提供一种将图片转换为语音的方法及装置,该装置易于实施,结构独特,功能丰富,特别适合盲人使用。专利技术的技术解决方案如下:一种将图片转换为语音的装置,在壳体(1)的背面设有显示屏(2)和扬声器(4);壳体内设有主板;主板用于获取照片,并针对照片进行文字识别形成文本文档,以及将文本文档转化为语音在扬声器中播放出来,以上实现均为现有成熟技术;壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);壳体的正面设有摄像头(16)和补光灯;壳体上还设有与主板连接的位置检测装置。所述的位置检测装置包括设置在壳体背面的导轨(8)以及设置在导轨上的滑块(10),为稳定起见,优选地,导轨为平行的两条;位置检测装置还包括设置在壳体内的2个同步轮(15)和张设在2个同步轮上的同步带(14);所述的滑块固定在同步带上与同步带联动;其中一个同步轮上设有同轴的编码盘,编码盘输出编码到主板。编码盘能记录同步转动的角度,从而能间接检测出滑块的位移,滑块用于播放控制,滑块位于最左侧时,一篇文章从头开始播放,滑块位于导轨的正中时,文章跳至50%的位置播放,更进一步,同步轮还连接有驱动电机,文章播放时,驱动电机驱动同步轮旋转,使得滑块同步移动,如播放到80%时,滑块也移动到80%的位置。壳体的顶部设有快门键(3),快门键用于控制摄像头,也可以不使用快门键,直接在屏幕上操作,显示屏为触摸显示屏。壳体上设有USB插口(12)和SD卡插槽(13)中的至少一种;用于插入U盘或SD卡等,将生成的文本文件存储到存储介质中,或将外部的文本文件通过存储介质转移到本装置中。壳体上设有耳机插孔。调压模块为调音按键或音量调节旋钮(6)。摄像头的左右两侧各设有1个作为补光灯的主闪光灯(17);壳体背面还设有由多个辅助闪光灯(19)和一片导光板(18)形成的环形闪光模块(导光板为回字形,由4条长方形的子板依次首尾回环连接而成,每条子板下方设有2个辅助LED灯。壳体为方形壳体);扬声器为2个,分布在壳体背面的左右两侧。形成立体声输出,音质好。壳体内设有电池和用于为电池充电的充电电路,壳体上设有于所述充电电路相连的充电接口(充电接口用于接电源适配器,电源适配器接220V交流市电)。壳体内集成有wifi模块或移动通信模块(3G或4G模块),用于通过网络获取文本资源。一种将图片转换为语音的方法,采用前述的将图片转换为语音的装置;包括以下步骤:步骤1:采用摄像头获取带有文字信息的图片;步骤2:主板上的文字识别模块将图片上的文字内容转换为文本信息,并将多个图片上的文字信息整合到一个文本文件中;步骤3:基于主板上的文本信息-语音转换模块将文本文件转换为音频播放。通过本装置可以将可视的图片、以及包括文字的纸质(或电子屏幕显示)页面实时转换为语音输出。包括以下步骤:第一步,数码摄像机对目标图片进行拍照,形成的图片文件存储到图片存储器;第二步,图片/文字译码器(即文字识别模块)读取图片文件,将图片文件转译处理为文本文件,形成的文本文件存储到文本存储器;第三步,文字/语音合成器(即文本信息-语音转换模块)读取文本文件,将文本文件转译和存储为音频文件,并根据该音频文件合成出语音信号;第四步,由音频处理放大器将音频信号进行放大后输出至扬声器播放。所述语音合成器内置有文字/语音合成器,将文本文件转换形成为音频信号并输出至音频处理放大器,由扬声器将放大后的语音播放出来;本装置设有图片/文字译码器,其利用类似于目前已经具有的将带有文字符号的图片转换为文本的软件工具,如通过对扫描仪扫描得到的图片转换为WORD文档或txt文档的软件工具,由微处理器单元控制图片/文字译码器将图片文字转换形成文本文件、控制文字/语音合成器将文本文件转换形成为音频信号,从而完成由图片到语音的转换;还设有图片存储器、文本存储器,可对图片、文本信息进行存储,微处理器单元可以通过数据线、地址线对图片或文本信息进行选择调用,可以具有一定的编辑功能,选择对特定语音的播放。这样,盲人使用起来比较方便,可以较快地学习掌握,实现对纸质或电子显示的图片的“阅读”。图片的边缘留有一定的空白:所述第一步设有一个拍摄完整度提醒功能,根据取景的外边缘的灰度判断目标是否已经全部进入镜头,进而通过语音提示相机镜头移动的方向,包括上/下、左/右、远/近动作指令。所述文字/语音合成器可根据设置选择语音的语种、男女声、语速。所述控制键盘与微处理器单元的控制信号输入端相连,该微处理器单元通过数据/地址线与图片/文字译码器、文字/语音合成器、图片存储器、文本存储器的相应数据端口或地址端口相连,并完成相应的控制和数据调用、存储动作;有益效果:本专利技术提供了一种将图片转换为语音的方法及装置,该装置特别针对盲人群体设计,比如位置检测装置能便于使用者手动调节播放进度,这一特征为本专利技术的最大亮点。另外,设置有物理按键,如播放键等,便于操作。本装置具有丰富的拍照功能,环形闪光模块有利于获取无阴影的高素质的图片;本装置具有丰富的接口和通信模块,USB接口等便于通过有线模式传输文本文件,wifi模块和移动通信模块便于通过无线网络方式传输文本资源,从而极大地扩展了本产品的功能。采用本装置能方便地将纸质的树制作成电子书,便于携带,另外,具有语音播放文本信息的功能,减缓使用者的视觉疲劳,该装置特别适用于盲人群体。附图说明图1为将图片转换为语音的装置的背面结构示意图;图2为将图片转换为语音的装置的正面结构示意图;图3为位置检测装置的结构示意图;图4为电原理框图。标号说明:1-壳体,2-显示屏,3-快门键,4-扬声器,5-充电接口,6-音量调节旋钮,7-下一首按键,8-导轨,9-暂停/播放按键,10-滑块,11-前一首按键,12-USB插口,13-SD卡插槽;14-同步带,15-同步轮,16-摄像头,17-主闪光灯,18-导光板,19-辅助闪光灯。具体实施方式以下将结合附图和具体实施例对本专利技术做进一步详细说明:实施例1:如图1-4.一种将图片转换为语音的装置,在壳体1的背面设有显示屏2和扬声器4;壳体内设有主板;主板用于获取照本文档来自技高网...
一种将图片转换为语音的方法及装置

【技术保护点】
一种将图片转换为语音的装置,其特征在于:在壳体(1)的背面设有显示屏(2)和扬声器(4);壳体内设有主板;壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);壳体的正面设有摄像头(16)和补光灯;壳体上还设有与主板连接的位置检测装置。

【技术特征摘要】
1.一种将图片转换为语音的装置,其特征在于:在壳体(1)的背面设有显示屏(2)和扬声器(4);壳体内设有主板;壳体上还设有与主板相连的调音模块和进程控制按键;进程控制按键包括下一首按键(7)、暂停/播放按键(9)和前一首按键(11);壳体的正面设有摄像头(16)和补光灯;壳体上还设有与主板连接的位置检测装置。2.根据权利要求1所述的将图片转换为语音的装置,其特征在于:所述的位置检测装置包括设置在壳体背面的导轨(8)以及设置在导轨上的滑块(10);位置检测装置还包括设置在壳体内的2个同步轮(15)和张设在2个同步轮上的同步带(14);所述的滑块固定在同步带上与同步带联动;其中一个同步轮上设有同轴的编码盘,编码盘输出编码到主板。3.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体的顶部设有快门键(3),快门键用于控制摄像头。4.根据权利要求1所述的将图片转换为语音的装置,其特征在于:壳体上设有USB插口(12)和SD卡插槽(13)中的至少一种。5.根据权利要求1所述的将图片转换为语音的装置,其特征在于:...

【专利技术属性】
技术研发人员:罗杰仁
申请(专利权)人:罗杰仁
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1