一种汉字书写界面的格式化方法。本发明专利技术目的是为汉语的识字和习字教学,中文字词的模糊输入提供高效的人机交互方式。为此本发明专利技术用十字型垂直交叉线和口字型方框相叠加,在人机交互界面上形成一个可称之为“十口格”的汉字书写方格,作用是将汉字书写区域划分成可以覆盖绝大多数汉字结构类型的汉字部件书写位置和边界。其特点在于:在十口格上书写汉字,不仅可以获得笔迹坐标、而且能够提取部件位置和汉字结构的信息。对于相当一部分汉字,只需要书写汉字的任意两个部件就可以将目标汉字与其他汉字区分开来,既使只书写一个汉字部件,也能有效缩小候选汉字的范围。用多个十口格可以进一步实现中文词语的模糊输入。
【技术实现步骤摘要】
本专利技术属于中文信息处理
本专利技术提出的中文人机交互书写界面的格式化方法及其衍生出的手写输入法,可以应用于汉语的识字、习字,以及汉语字词的手写输入和模糊查找等方面。
技术介绍
基于计算机的信息技术迅速发展使西方的“键盘文化”在中国大兴其道,而以书写为基础的汉语识字和习字教育,因缺乏与信息化同步的现代教学工具,呈现出令人担忧的状况。中文手写输入技术的进步,使得人们能够摆脱对键盘的完全依赖,甚至在手持信息设备的文字输入上,笔显示出优于键盘的强势。但是人们用笔书写文字的传统习惯并没有因此得到回归,而且汉字书写的热情和兴趣呈现持续下降的趋势。相对于键盘,用笔逐字书写的确又慢又累。至今为止还没有一种能够与键盘输入相媲美的轻松高效的中文手写输入方法,更没有能够唤起人们尤其是年轻人对汉字书写文化的普遍兴趣的汉语习用工具。
技术实现思路
本专利技术用十字型垂直交叉线和口字型方框相叠加,在人机交互书写界面上形成一个可称之为“十口格”的汉字书写方格。十口格的作用是将汉字书写区域划分成可以覆盖绝大多数汉字结构类型的汉字部件书写位置和边界。其特点在于在十口格上书写汉字,不仅可以获得笔迹坐标、而且能够提取部件位置和汉字结构的信息。因此对于相当一部分汉字(尤其是笔画繁多的汉字),只需要书写汉字的任意两个部件就可以将目标汉字与其他汉字区分开来,即使只书写一个汉字部件,也可以有效缩小候选汉字的范围。利用多个十口格可以进一步实现中文词语的模糊输入。十口格的构造如附图1所示。汉字最常见的结构是上下结构、左右结构和内外结构。为此本专利技术用十字型垂直交叉线和口字型方框相叠加,将汉字书写方格内的书写区域从纵向、横向和内外等三个维度上进行多种分割,主要包括●十字线将书写区域从纵横两个方向划分成二等分;●口字内框将书写区域从纵横两个方向划分成三等分;●十字线与口字外框将书写区域从纵横两个方向划分成四等分;●口字外框将书写区域分成内外两部分。以上的四种分割,以及不同分割的组合,对汉字书写界面进行格式化,从而形成十口格汉字书写模板。格式化后的汉字书写方格与绝大多数汉字字型结构形成了一一对应的关系。具体如表1所示。 表1十口格与汉字结构的对应关系 (续表1) 在十口格上书写汉字,不仅可以得到书写笔迹信息,而且还能提取到汉字部件的位置信息和汉字结构信息,从而为机器识别提供了更丰富更完整的数据。本专利技术将这三方面的信息统称为汉字的“字形三维信息”。汉字部件手写输入法是本专利技术总体构思下的衍生方法,该方法包括(1)在十口格汉字书写模板上书写任意一个(并非第一个)或几个(并非相邻)汉字部件;(2)提取包括书写笔迹、部件位置和汉字结构等在内的字形三维信息,提供给汉字识别系统进行识别;(3)汉字部件不仅是指在汉字中反复出现的固定笔画组合块,而且还包括汉字的首笔、末笔,以及中轴笔等特殊笔画。将汉字部件手写输入法用于中文词语的手写输入,从而衍生出中文词语模糊输入法。该方法包括(1)将两个或两个以上的十口格排列起来,形成中文词语手写输入界面;(2)按照汉字部件手写输入法(1)书写词语中的任意一个或几个汉字;(3)可以任意选择词语中的部分汉字,省略不写;(4)按照汉字部件手写输入法(2),对至少书写了一个部件的汉字进行识别;(5)根据识别出的汉字在词语中所处位置以及词语的长度,推断目标词语。本专利技术的作用主要包括以下几个方面(1)十口格与绝大多数汉字在结构上有着一一对应的关系,用本专利技术进行识字教学,可以强化识字者对汉字结构和部件的记忆。(2)十口格规范了汉字部件的书写位置和边界,用本专利技术进行习字练习,有助于习字者写出布局合理美观的方块字。(3)在汉字手写输入方面,本专利技术以汉字部件为最小书写单位,无须整字书写,每个汉字均可以自由选择书写任意一个或多个部件,从而降低了汉字手写输入系统对人的书写要求,同时也降低了对汉字机器识别能力的要求。(4)两个以上十口格排列起来,可以构成中文词语手写输入界面。在词语输入的场合,不仅可以省略一个汉字的某些部件,而且可以省略词语中的部分汉字。从而进一步提高中文手写输入的效率,进一步降低对输入者的汉字书写要求。(5)汉字部件手写输入法的本质之一是“模糊输入”。汉字中不会写的部件可以不写,词语中的记不住的汉字可以省略。诸如提笔忘字,难字只会写半边,词到用时想不起来等困惑我们写作的问题,一般的手写输入方法是无能为力的,基于本专利技术的汉字部件输入法则可以应付自如。(6)以本专利技术为基础可以形成一种汉字和词语的模糊查找服务,通过互联网提供给广大网民使用。以便人们随时随地查找那些记不清写不全的汉字和词语。以该服务为核心可以发展成为一种基于互联网的汉语习用服务新模式。(7)汉字部件手写输入法的本质之二是“自由省略”。由于省略的部分不同,省略的程度不同,从某种意义上说,识别汉字变成了猜字,识别词语变成了猜词。猜出来的字和词可能是一个,也可能是多个。如果是多个字或词,那一定是在结构和部件上有着某些共同特征的一组字或词,对于中文输入来说,可称其为候选字词,而对于汉语造字构词的研究来说,本专利技术提供了一种新的分类方法和解析工具。(8)汉字部件手写输入法是让机器依据有限的笔迹、位置和结构信息,猜出输入者所写的汉字或词语。这样的过程让人来做,便是猜字游戏。把人猜出的结果与机器猜出的结果加以对照,给出评分,从而加深已学字词的记忆,同时学习新的字词。这便是本专利技术独特的游戏化汉语学习过程。(9)自由省略的另一个好处是将汉字手写输入变成一个可以不断追求更高效率的过程。省略什么,省略多少,完全由自己决定。经过不断的尝试和总结,一定能够做到“写的最少,输入最多”。这类似于闯关游戏。本专利技术可以做成汉字手写输入竞赛游戏,既可以自己和自己比,也可以多人竞赛。把汉语学习寓于娱乐之中,提高人们尤其是年轻人学习汉语的乐趣。附图说明图1十口格的构造和各部分比例关系。图2单字书写界面。其中主要部分是十口格汉字书写模板。候选字词列表框和工具条是附属部分,具体作用参见本说明书中“具体实施方式”一节中的说明。图3双字词书写界面。图4三字以上词汇书写界面(也可以书写单字和双字词)。图5只书写汉字的偏旁,目标汉字出现在候选字中。图6只书写汉字的两个部件,候选汉字中只有目标汉字。图7只书写双字词中第一个汉字的一个部件,目标词出现在候选词中。图8每个汉字各书写一个部件,候选汉字中只有目标词。图9只书写短语中部分汉字各一个部件,候选汉字中只有目标短语。具体实施例方式本专利技术的一个具体实施例是用十口格汉字书写模板组成的汉语字词模糊输入的人机界面软件。该软件是基于B/S模式的客户端程序(以下简称实施程序)。实施程序既可以运行在装有Windows XP Tablet中文操作系统的平板电脑上,也能运行在其他Windows系列计算机上。二者的区别在于前者是以触摸笔为书写工具,后者是以鼠标为书写工具。以下结合附图对本专利技术作进一步的说明。实施程序主要由两个文件组成,一个是HTML文件skg.html,另一个是JAVASCRIPT文件skg.js,在skg.html中需要用到。在IE浏览器中打开skg.html,出现如图2所示的界面。该界面由三部分组成,其中包括●十口格汉字书写模板。用来书写单个汉字;●候选字词列表框。用本文档来自技高网...
【技术保护点】
一种汉字书写界面的格式化方法,该方法包括:(1)用十字型垂直交叉线和口字型方框相叠加,将汉字书写方格内的书写区域从纵向、横向和内外等三个维度上进行多种分割,主要包括:●十字线将书写区域从纵横两个方向划分成二等分;●口字内框将书写区域从纵横两个方向划分成三等分;●十字线与口字外框将书写区域从纵横两个方向划分成四等分;●口字外框将书写区域分成内外两部分。(2)通过以上四种分割,以及不同分割的组合,对汉字书写界面进行格式化,从而形成十口格汉字书写模板;(3)格式化后的汉字书写方格与绝大多数汉字字型结构形成一一对应的关系。
【技术特征摘要】
1.一种汉字书写界面的格式化方法,该方法包括(1)用十字型垂直交叉线和口字型方框相叠加,将汉字书写方格内的书写区域从纵向、横向和内外等三个维度上进行多种分割,主要包括●十字线将书写区域从纵横两个方向划分成二等分;●口字内框将书写区域从纵横两个方向划分成三等分;●十字线与口字外框将书写区域从纵横两个方向划分成四等分;●口字外框将书写区域分成内外两部分。(2)通过以上四种分割,以及不同分割的组合,对汉字书写界面进行格式化,从而形成十口格汉字书写模板;(3)格式化后的汉字书写方格与绝大多数汉字字型结构形成一一对应的关系。2.汉字部件手写输入法,该输入法包括(1)在十口格汉字书写模板上书写任意一...
【专利技术属性】
技术研发人员:董为群,高静敏,
申请(专利权)人:高静敏,董为群,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。