当前位置: 首页 > 专利查询>微软公司专利>正文

用于亚洲语言的手写输入的方法和系统技术方案

技术编号:2931135 阅读:297 留言:0更新日期:2012-04-11 18:40
描述了一种用于协助用户以亚洲语言输入信息的系统和进程。在一些方面中,参照手写输入描述了简体中文和其它语言的输入。

【技术实现步骤摘要】

本专利技术的方面涉及硬件和软件产品,尤其涉及向用户提供以亚洲语言输入信息的改进过程。(2)
技术介绍
计算系统以多种语言存在。这些语言包括单词的基于字符的表示和基于符号的表示。尽管在世界上广泛使用西文104键盘,然而基于符号的语言的用户需要一种使用键盘所提供的有限输入来输入符号的方法。一种输入符号语言的方式是使用对一种语言专用的输入法编辑器(微软公司的IME)。亚洲语文本输入是当今最具挑战性的计算问题之一。它一直是亚洲语言计算的瓶颈。亚洲语言字符集随Unicode(统一代码)标准的每一次修订而不断增长。例如,Unicode 2.0中定义的CJK(中文、日文、韩文)字符为20,902字符。Unicode3.0中包括了27,484个字符。扩展B进一步添加了40,771个字符。IME提供了一种将英文字母转换成亚洲语字符的转换引擎。一般而言,对亚洲语字符的编码基于亚洲语字符的语音。这可能包括字母或字母和数字的组合。有时候,需要将英文发音转换成亚洲语言的发音。而且,英文文本可能与亚洲文本相组合(和/或与符号、拼音字母/字符和亚洲语象形文字(中文字符)混合),因此需要能够快速且容易地在编码方法之间进行切换。有许多与前述方法相关的问题a.尽管手写输入比键盘输入更自然,然而键盘输入仍是亚洲语言的主要输入机制。b.尽管手写输入通常对中文字符来说速度较快,然而拼音的键盘打字速度较慢。c.传统的手写识别输入需要用户书写中文字符(东亚象形文字)。因为中文字符由许多笔画组成,因此书写中文字符较复杂。同时,当前中文手写体识别输入法需要用户以分离的笔画(非草体的)书写,来达到较高的识别率(精确度)。组合而言,复杂性、非草体性书写以及低精确度(基于误差纠正率)令手写体识别输入的速度变慢。需要一种改进的系统来使得用户能够快速且容易地以亚洲语言输入文本。(3)
技术实现思路
本专利技术的各方面解决上述一个或多个问题,由此为以亚洲语言的文本输入提供一种解决方案。本专利技术的各方面包括使用输入笔输入信息的能力。参照附图和相关描述说明这些和其它方面。(4)附图说明本专利技术的各个方面在附图中说明。图1和2示出了支持本专利技术一个或多个方面的通用计算环境。图3和4示出了能够使用本专利技术的各方面的各类硬件用户接口设备。图5-8示出了依照本专利技术各方面的各类用户接口。图9示出了依照本专利技术实施例用于输入手写信息的用户接口。图10和11示出了手写信息的示例。图12-13示出了依照本专利技术各方面的流程图。(5)具体实施方式本专利技术的各方面涉及提供以亚洲语言输入文本的能力。下文被分成各个部分来帮助用户理解。这些标题包括墨水的特征;通用计算环境;硬件输入;用户接口;以及手写用户输入接口。墨水的特征使用墨水钢笔的用户知道,物理墨水(使用具有墨水囊的钢笔时留在纸上的那一种)可能比一系列由直线段连接的坐标传达更多的信息。例如,物理墨水可以反映钢笔压力(由墨水的浓度来反映)、钢笔角度(由直线或曲线段的形状和离散点附近的墨水的形态来反映)以及钢笔尖的速度(由直线性、线宽和随直线或曲线的路线的线宽改变来反映)。因为这些额外的性质,要比使用点之间的统一线段宽度更能传递感情、个性、强调等等信息。电子墨水(或墨水)涉及当用户使用基于输入笔的输入设备时所捕获的电子信息的捕获和显示。电子墨水是指一列笔画,其中每一笔画包括一系列点。点能够用多种已知技术来表示,包括笛卡尔(Cartesian)坐标(X,Y)、极坐标(r,Θ)以及本领域已知的其它技术。电子墨水可包括对真实墨水的性质,包括压力、角度、速度、颜色、笔尺寸以及墨水的不透明性的表示。电子墨水还可包括其它特性,包括墨水沉积到页面上的顺序(对大多数西文语言来说是从左到右然后往下的线栅方式)、时间信息(指示墨水何时沉积)、对墨水的作者的指示以及起源设备(墨水在其上汲取的机器的标识或用于沉积墨水的钢笔的标识的至少其中之一)。术语墨水具有特性的笔画序列或笔画集。一个笔画序列可包括按序排列的笔画。该序列可能以捕获时间为序或以笔画出现在页上位置为序或者在协作的情况下按墨水的作者排序。也可以使用其它顺序。笔画集可包括多个笔画序列或未排序笔画或其任意组合。一些性质还可能对每一笔画或笔画中的点来说是特有的(例如,压力、速度、角度等等)。这些性质可储存在笔画级或点级,而非墨水级。墨水对象储存带有性质或不带有性质的墨水的数据结构。笔画捕获的点的序列或集合。例如,当显示时,点的序列可用直线来连接。可选地,笔画可以以点和在下一点的方向上的矢量来表示。简而言之,笔画包含与墨水相关的点或线段的任意表示,而不考虑点和/或连接点的东西背后隐含的表示是什么。点 定义在空间中所处位置的信息。例如,点可以是相对于捕获空间(例如,数字化仪上的点)、虚拟墨水空间(向其中放置捕获的墨水的空间中的坐标)和/或显示空间(显示设备的点或像素)来定义。文档具有可见的表示和内容的电子文件。文档可包括web页、字处理文档、记事页或记事簿、电子表格、可视演示、数据库记录、图像文件、以及它们的组合。通用计算环境图1和2说明了适于在其中实现本专利技术的操作环境100和201的示例。操作环境100和201仅为合适的计算环境的几个示例,并非对本专利技术的使用或功能的范围的限制。适于本专利技术使用的其它众所周知的计算系统、环境和/或配置包括但不限于,个人计算机、服务器计算机、手持式或膝上设备、多处理器系统、基于微处理器的系统、可编程消费者电子设备、网络PC、小型机、大型机、包括任一上述系统或设备的分布式计算环境等等。本专利技术的各个方面可以在计算机可执行指令的一般语境下描述,计算机可执行指令如由一个或多个计算机或其它设备执行的程序模块。一般而言,程序模块包括例程、算法、程序、对象、组件、数据结构等等,执行特定的任务或实现特定的抽象数据类型。通常而言,根据各种实施例所期望的,程序模块的功能可以组合或分布。计算设备系统100和201通常包括至少某些形式的计算机可读媒质。计算机可读媒质可以是任一服务器103或系统201可访问的可用媒质。作为示例而非限制,计算机可读媒质可包括计算机存储媒质和通信媒质。计算机存储媒质包括易失和非易失、可移动和不可移动媒质,以任一方法或技术实现以储存诸如计算机可读指令、数据结构、程序模块或其它数据的信息。计算机存储媒质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光学存储、盒式磁带、磁带、磁盘存储或其它磁存储设备或其它任一可用来储存期望的信息并可由服务器103或系统201访问的媒质。通信媒质通常包括以已调制数据信号如载波或其它传输机制形式的计算机可读指令、数据结构、程序模块或其它数据,并包括任何信息传递媒质。术语“已调制数据信号”指其一个或多个特征以对信号内信息编码的方式设定或改变的信号。作为示例而非局限,通信媒质包括有线媒质如有线网络或直接连线连接、以及无线媒质如声学、RF、红外和其它无线媒质。上述任一组合也应当包括在计算机可读媒质的范围之内。参考图2,用于实现本专利技术的各方面的说明性系统包括计算装置,如装置201。在其最基本的配置中,装置201通常包括处理单元204和存储器203。根据计算装置的确切配置和类型,存储器203可以是易失(如RAM本文档来自技高网
...

【技术保护点】
一种用于输入字符的进程,其特征在于,它包括以下步骤:从用户接收输入,所述输入包括墨水;以及将所述墨水识别为语音输入;将所述语音输入转换为字符。

【技术特征摘要】

【专利技术属性】
技术研发人员:李东张东晖章勇
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1