笔型语音计算机及其产生方法技术

技术编号:5817602 阅读:169 留言:0更新日期:2012-04-11 18:40
一种用以产生语音索引表的笔型语音计算机及其产生方法。语音索引表的产生方法包括通过麦克风记录语音数据,通过手写输入装置输入图形数据而产生语音数据的手写索引,以及找出手写索引与对应的语音数据之间的关联性,以产生语音索引表。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种笔型语音计算机(pen-type voice computer),特别涉及一 种笔型语音计算机的数据索引。
技术介绍
在传统技术中,学生使用笔来抄笔记并且使用语音记录器(voice recorder)将上课内容录音。同样,记录员或新闻工作者在访谈中会手写笔记 并且录音。然而,存储语音数据需要相当多的存储器容量,且通过传统技术来搜 寻特定语音数据也是相当不容易的。使用者通常都会盲目地搜寻全部的语 音数据来找出想要的数据,因而耗费了许多不必要的时间与精力。有鉴于此,期望设计一种可轻易地搜寻录音档中特定数据的装置。因 此,本专利技术公开一种用来产生搜寻索引并且执行索引搜寻的方法与装置。
技术实现思路
以下将配合图示详细i兌明本专利技术的实施例。 笔型语音计算机的特性包括两个输入端-笔输入以及麦克风, 一个输出端-喇叭/耳机。 三个可同时操作的输入/输出。适用于笔输入的内建式手写辨识,适用于语音以及文字至语音的内建 式语音辨识,使得服务器至笔型语音计算机之间的传输以数据取代语音。 建造为两个元件--笔以及语音接口 (麦克风+喇p八/耳机)。 语音接口部分为一头戴受话器(headset)。通过无线的方式可以接入网络、服务器、喇叭、键盘以及屏幕。 笔输入以及语音记录可以同时执行,笔输入的最后一个片段可与语音 串流有关联。在经过通过手写辨识执行辨识后,最后一个片段变为索引(文字)。语音串流的相关片段可通过语音辨识而变为索引(文字)。 通过索引可用以搜寻以及播放语音记录。通过比语音更多的文字即可使语音串流与服务器进行通信。通过按钮来表示可输入的连接字串(concatenated text string)。 笔输入、语音记录以及喇p八/耳机可以同时操作。 通过手写辨识可使手写输入转变为文字。 通过语音辨识可使语音输入转变为文字。喇叭/耳机可通过文字至语音程序持续地播放来自手写输入与记录中的 文字。附图说明为了能充分了解本专利技术,将配合以下图示及实施例做说明,其中 图1是显示根据本专利技术实施例所述的笔型语音计算机的方块图。 图2是显示根据本专利技术实施例所述的使用图1的笔型语音计算机的流 程图。图3是显示根据本专利技术一实施例所述的使用图1的笔型语音计算机与 图2的流程图所搭配的查找表。图4a以及图4b是显示使用图1的笔型语音计算机、图2的流程图以 及图3的查找表来产生索引的方法。图5是显示根据本专利技术另一实施例所述的使用图1的笔型语音计算机 与图2的流程图所搭配的查找表。具体实施例方式以下将介绍适用于根据本专利技术所述的优选实施例。必须说明的是,本 专利技术提供了许多可应用的专利技术构思,所公开的特定实施例仅是说明达成以 及使用本专利技术的特定方式,不可用以限制本专利技术的范围。图1是显示根据本专利技术实施例所述的笔型语音计算机1的方块图,包 括天线IO、收发器ll、麦克风模块12、手写输入单元13、处理器14、存 储器15、电池16、喇叭/耳机17以及控制按钮18。收发器ll、麦克风模块 12、手写输入单元13、存储器15以及喇叭/耳机17全部都耦接至处理器14, 其中收发器11耦接至天线10。5电池16耦接至笔型语音计算机1中的所有元件以提供所有元件的电力需求。通过天线10与收发器11可以将数字信号传送至远端计算机以及接收 来自远端计算机的数字信号,以执行数据存储或后数据处理(请提供相关例 子)。天线10可以通过蓝牙(Bluetooth)、无线局域网络或是其他射频技术以 及红外线数据协会(infrared data association, IrDA)技术与远端计算机进行通信。麦克风模块12可包括麦克风单元122与124的麦克风阵列以及模拟至 数字转换器(analog to digital converter, ADC)120。麦克风单元122与124 仅接收特定角度覆盖范围内的方向语音信号(directional voice signal),如此 一来便可以消除特定角度覆盖范围外的信号源。ADC 120接收来自麦克风 单元122与124的模拟语音信号并将其转换为数字数据。手写输入单元13 接收来自写入端(writingtip)的写入信号,写入端可以为笔或描画针(stylus)、 触控板、鼠标或是光学扫描器。即时(realtime)应用系统通过手写辨识软件 应用程序来检测或辨识描画针、触控板或是鼠标所接收的使用者手写输入 而产生二进位格式、文字格式或是任何适用于数据存储与转换的格式。对 于离线应用系统来说,通过光学扫描器所扫瞄的文件或手写输入可在处理 器14中进行辨识。手写信号可以为文数字符(alphanumericcharacter)、图形 或图案。喇。八/耳机18接收来自处理器14的模拟音频信号并且将音频信号传送 至四周给使用者听。存储器16提供暂时的数据存储空间给处理器14使用,使得程序代码 可以被处理器14执行。存储器16可以为随机存取存储器(Random access Memory, RAM)、只读存储器(Read-Only Memory, ROM)、快取存储器或 是上述的组合。处理器14可以为数字信号处理器(digital signal processor, DSP)。处理 器14接收来自麦克风模块12与手写输入单元13的数字数据并且执行数据 处理。数据处理包括数据录音、语音辨识、手写辨识、产生索引、数据压 缩、索引搜寻、产生音频信号以及输入/输出操作。数据录音暂时记录数字 化音频数据或是数字化手写数据以执行数据辨识。语音辨识辨认语音字符, 并将已辨识的字符转换为可用于数据传输与存储的形式,包括文字、二进位或其他计算机可读取的形式。手写辨识辨识手写文字或是图形等,并将 已辨识的文字转换为可在本地存储器或远端计算机执行数据传输与存储的 形式。产生索引于数字化数据处标记索引,使得使用者在之后可以搜寻具有已知索引的标记数据。索引可以为从麦克风模块12或手写输入单元13 所输入的文数字符或是通过手写输入单元13所输入的图形。数据压缩是将 数字数据执行压缩以减少其数据量,使得数据存储更具经济效益,并且可 以降低与远端计算机执行传输的数据传输量。索引搜寻寻找在产生索引的 操作中标记为预定索引的数据。产生音频信号接收来自远端计算机的压缩 数据,将数据解压缩并且转换为可以被使用者辨识的模拟音频波形。输入/ 输出操作提供笔型语音计算机1与外部装置之间的输入与输出数据的存取。控制按钮18可以接收使用者输入并且辨认对应的数据处理,包括数据 录音、语音辨识、手写辨识、产生索引、数据压缩、索引搜寻、产生音频 信号、语音重播、数据确认与校正。控制按钮18可以为机械开关、电子开 关、触控式开关(on-screen switch)或是上述的组合。图2显示使用图1的笔型语音计算机的流程图,包括判断指令S20、 数据录音S200、语音辨识S201、产生索引S2010、数据压缩S2011、手写 辨识S202、产生索引S2020、数据压缩S2021、语音输出S203、索引搜寻 S204、输入/输出操作S205、语音重播S206、数据确认与校正S2060。当控制按钮18接收输入数据来启动数据处理时,处理器14编译并执 行对应于输入数据的指令(S20)。在数据录音辨本文档来自技高网...

【技术保护点】
一种产生方法,用以在一笔型语音计算机中产生具有一手写索引栏、文字索引栏、语音索引栏以及应用索引栏的一语音索引表,包括: 通过一麦克风记录一语音数据; 通过使用一手写输入装置输入一图形数据启动一控制按钮用以产生上述语音数据的一手写 索引;以及 找出上述手写索引与对应的上述语音数据之间的关联性,以产生上述语音索引表。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:黄炎松
申请(专利权)人:美商富迪科技股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1