当前位置: 首页 > 专利查询>刘君度专利>正文

集拼音和字形编码多种方式于一体的汉字输入系统技术方案

技术编号:14167811 阅读:142 留言:0更新日期:2016-12-12 14:49
本发明专利技术涉及一种使用普通英文字母键盘或触摸屏虚拟软键盘将汉字以多种编码方式输入到计算机、平板电脑和手机等电子设备进行中英文信息处理和通讯的汉字输入方法。该方法无需对汉字进行拆分,以定位取码抽取汉字字形的特征字根和字音特征,通过改变字音编码元素和字形编码元素的组合成份以及码元位置的变化构建具有多种编码输入方式的汉字输入集成系统。通过触摸屏虚拟软键盘的提示功能实现双拼韵母和编码字根布局免记忆,解决现有拼音输入方法不能准确打字和字形输入方法编码字根难以记忆的问题,实现对国标GB2312‑80字库以及UNICOD繁体、简体等大字符集汉字以同一编码规则进行编码的通用汉字编码输入方法。

【技术实现步骤摘要】
一、
本专利技术涉及一种用于计算机、平板电脑和手机等微电子设备信息处理的汉字键盘编码输入技术,特别是使用普通英文字母键盘和触摸屏的虚拟软键盘将汉字、英文字符、标点符号以多种编码方式输入到计算机、平板电脑和手机等微电子设备进行中英文信息处理和通讯的汉字规范编码方法。二、
技术介绍
随着计算机、平板电脑和移动电子通信设备的社会拥有量迅速增长和触摸屏虚拟键盘的出现,人们愈来愈多的使用智能拼音来输入汉字,但汉字的同音字太多,输入单字时无可避免的要翻页找字,不仅耗费脑力,而且大大降低了输入效率。目前的智能拼音输入法主要是附加手写或者笔画输入法以及增加辅助字根以区分同音字,但手写和笔画输入法需要转换输入方式,仍然没有解决打字的效率问题,而增加辅助字根的打字方式又多达一、两百个之多,因记忆量大而难以被用户接受。智能拼音输入近年来以网络搜索的方式在词组和语句输入方面虽有所改善和成效,但单字输入的重码问题却始终未能解决。由于智能拼音长期以来一直存在单字输入重码多而需要频繁找字和选词的缺陷,因而不能适应金融系统、出版行业和档案管理等对汉字输入准确度要求较高的领域。三、
技术实现思路
本专利技术旨在提供一种无须转换输入方式的拼音和字形编码相结合的汉字键盘输入集成系统,目的是解决当前智能拼音输入法单字输入时重码字太多,打字效率低,不能适应金融、出版和档案管理等行业需要准确输入汉字的要求。该系统集成了多种汉字编码输入方式以适应文化层次不同的用户和对打字有特殊要求的工作环境,习惯于拼音打字的用户仍可以按照拼音输入方式打字,无须改变自己原来用拼音输入的习惯和方法,如果需要准确、快速打出所需要的汉字时则继续键入该字的首字根和尾字根,既兼容了使用人数众多的拼音输入法,又很好地解决了拼音输入时重码多找字难的问题。如果不熟悉拼音或有不认识的字则可用纯字根的方式输入汉字,既解决了拼音不能输入不认识的生僻字,而形码又不能输入不会写的字的难题。通过本专利技术屏幕虚拟软键盘的韵母和编码字根提示功能,使拼音、字形输入方式成为一种既简便快捷,又无需强记,能即学即用,同时又适用于金融系统、出版行业和档案管理等部门的理想汉字输入方法。1、编码思想本专利技术以汉字的字音特征和字形特征相互组合构成多种汉字编码,将这些汉字编码有选择的集于一体,从而构成多种输入方式并存的汉字输入集成系统。为解决汉字拼音输入方式单字重码太多和打字效率低的问题,本专利技术创建了26个描述汉字字形的特征字根,并建立汉字字首成字偏旁与字末成字偏旁的概念,进一步解决生僻字的输入问题,从而实现以拼音方式、字形编码方式以及拼音与字形组合编码方式输入汉字。本专利技术的汉字编码方法是这样实现的:以计算机通用的标准键盘或平板电脑、手机等微电子设备的触摸屏虚拟软键盘的26个英文字母,对本专利技术的26个汉字字形的特征字根以及汉语拼音的声母和韵母按一定的规则建立对应的英文字母代码,以键入英文字母代码的形式有选择的将汉字拼音的声母、韵母以及汉字字形的首形码、尾形码、补形码、特征码组成的汉字编码输入计算机或者手机等微电子设备实现汉字的准确输入。汉字编码采用在固定位置取码,不需要对汉字进行拆分,彻底消除了由于汉字拆分所出现的各种问题,既降低了编码字根记忆和取字形编码的难度,又解决了从国标GB2312-80字库到GB18030-2000以及UNICOD繁体、简体等大字符集的汉字编码输入问题。2、汉字拼音的声母代码和韵母代码(1)汉字拼音的声母代码本专利技术汉字拼音的声母以其首字母为声母代码,没有声母的汉字,以韵母的首字母为声母代码。例如:双声母zh、ch、sh的汉字只输入z、c、s。“按”字只有韵母an没有声母,以韵母的首字母a为声母代码。本专利技术双拼音形输入方式的声母代码与计算机通用键盘上的英文字母直接对应。(2)汉字拼音的韵母代码本专利技术汉字拼音的韵母根据输入方式不同有不同的字母代码:①在全拼音形输入方式中直接以汉字拼音为汉字的拼音代码。②全拼音形输入方式韵母中的ng以字母g为代码,一个汉字音节最长为四个字母代码。③在双拼音形输入方式中的韵母代码,由该输入方式规定每个完整的韵母以一个英文字母为代码。3、汉字的编码字根和取码规则(1)汉字字形的编码字根本专利技术是以文字描述汉字笔形特征的方式将汉字的编码字根进行科学的分类,从而把大量看似毫无规律的汉字字根归类整合为26个,并使之与26个英文字母按象形或意会的关系建立有理化的关联。在取汉字字形的字根代码时,只需观察汉字首、尾或右上角的固定位置是否有下述的编码字根或与之类似的笔形态特征即可取出对应的字母代码,无需对汉字进行拆分取码。本专利技术对汉字字形的首形码、尾形码、补形码、特征码的定义如下:首形码为汉字左上角最高的笔形特征的英文字母代码;尾形码为汉字右下角最低的笔形特征的英文字母代码;补形码为汉字右上角最高的笔形特征的英文字母代码;特征码为去掉汉字右上角所取的补形码后,对余下部分再次取补形码;汉字字形的编码字根与对应的英文字母代码如下:应该理解的是,本专利技术的字根体系和字根对应的英文字母代码在键盘上的布局是输入法的核心技术,对本领域普通技术人员来说,可以根据上述说明改变部分字根或变换字根所对应的英文字母代码键位,或者将其应用于其它的输入法,而所有这些改变或变换以及用于其它的输入法都应属于本专利技术权利要求的保护范围。(2)汉字字形的取码规则字形取码规则是根据本专利技术对汉字首形码、尾形码、补形码、特征码的定义在汉字字形的固定位置抽取编码字根,然后以字根代码的形式输入计算机或平板电脑、手机等微电子设备,汉字字形的取码规则如下:①一个笔画或部件占用多个角位时,可以重复取同一个字母代码。例如:“重”的撇占据左上角和右上角,首形码和补形码均为J,其字全形编码为JEJ。“树”的右下角和右上角都是横和竖两笔垂直交叉,尾形码和补形码均为H,其全字形编码为FHH。“木”的左上角、右下角和右上角都占据,首形码、尾形码、补形码均为F,其全字形编码为FFF。②字形缺角无笔画可取时直接取字母代码A。例如:“严”的右下方缺角无笔画,尾形码应为A,其字全形编码为EAE。“辶”的右上方缺角无笔画,补形码应为A,其全字形编码为URA。③折笔画可以看成是由转折处断开的两个笔画组成,然后分别取各自笔形所对应的字母代码。例如:“司”的折笔画可以看成是由转折处断开的横和竖组成,首形码、尾形码分别为EI,其全字形编码为EIL。“巨”的折笔画可以看成是由转折处断开的竖和横组成,右下角的尾形码应为E,其全字形编码为LEE。④首、尾两处不同的字根共用同一个笔画时,可以分别取各自对应的字母代码。例如:“果”字中间的竖笔画贯穿上、下两个字根,应分别取左上角首形码的“实口”字根Q和右下角尾形码的“木”字根F,其全字形编码为QFQ。“未”字中间的竖笔画贯穿上、下两个字根,应分别取左上角的“直穿插”和右下角的“木”字根,其全字形编码为MFM。⑤优先取笔画多的大字根或部件的字母代码。例如:“望”左上角的首形码不取单笔画“点”,应取较大的部件点与横的组合“高字头”的字母代码A;右下方的尾形码不取单笔画“横”,应取较大的字根“王”的字母代码Z;右上角的补形码不取“直角”部件,应取较大的字根“月”的字母代码P,“望”的全字形编码为AZP。⑥字首是草字头(艹)、气字头本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201610335019.html" title="集拼音和字形编码多种方式于一体的汉字输入系统原文来自X技术">集拼音和字形编码多种方式于一体的汉字输入系统</a>

【技术保护点】
一种中文信息处理的汉字编码输入方法,该方法的汉字编码由汉字拼音和字形编码两部分组成,依据汉字的取码规则构成有双拼音形编码、全拼音形编码、简拼音形编码、简拼形音编码、字形编码多种输入方式的汉字键盘输入系统,配备具有打字以及声母、韵母和编码字根提示功能的屏幕虚拟软键盘,其特征在于:(1)所述汉字拼音的声母以其首字母为声母代码,没有声母的汉字,以韵母的首字母为声母代码;(2)所述汉字拼音的韵母根据输入方式不同有不同的字母代码:①在全拼音形输入方式中直接以汉字拼音为汉字的拼音代码,一个汉字音节最长为六个字母代码;②全拼音形输入方式韵母中的ng以字母g为代码,一个汉字音节最长为四个字母代码;③在双拼音形输入方式中的韵母代码,由该输入方式规定每个完整的韵母以一个英文字母为代码;(3)所述字形编码字根是以文字描述汉字笔形特征的方式将汉字的编码字根进行科学的分类,从而把大量看似毫无规律的汉字字根归类整合为26个,并使之与26个英文字母按象形或意会的关系建立有理化的关联;汉字的字形编码由汉字字形的首形码、尾形码、补形码、特征码构成,其约定的意义是:首形码为汉字左上角最高的笔形特征的英文字母代码;尾形码为汉字右下角最低的笔形特征的英文字母代码;补形码为汉字右上角最高的笔形特征的英文字母代码;特征码为去掉汉字右上角所取的补形码后,对余下部分再次取补形码;汉字字形的编码字根所对应的英文字母代码如下:(4)本专利技术的字根体系和字根对应的英文字母代码在键盘上的布局是输入法的核心技术,对本领域普通技术人员来说,可以根据上述说明改变部分字根或变换字根所对应的英文字母代码键位,或者将其应用于其它的输入法,而所有这些改变或变换以及用于其它的输入法都应属于本专利技术权利要求的保护范围;(5)所述汉字字形的取码规则如下:①一个笔画或部件占用多个角位时,可以重复取同一个字母代码;②字形缺角无笔画可取时直接取字母代码A;③折笔画可以看成是由转折处断开的两个笔画组成,然后分别取各自笔形所对应的字母代码;④首、尾两处不同的字根共用同一个笔画时,可以分别取各自对应的字母代码;⑤优先取笔画多的大字根或部件的字母代码;⑥字首是草字头(艹)、气字头(气)、竹字头()、病字头(疒)覆盖的汉字,在取右上角的补形码时,应先将其移除后再取右上角的补形码,以避免与首形码取同一个字根的代码;⑦外围是“口、门”两类的汉字,在取右下角的尾形码时,改取其框内右下角的笔形编码,但在“口、门”外围有附带的笔画时,仍同一般的汉字取其右下角的笔形编码。...

【技术特征摘要】
2015.05.28 CN 20151028029611.一种中文信息处理的汉字编码输入方法,该方法的汉字编码由汉字拼音和字形编码两部分组成,依据汉字的取码规则构成有双拼音形编码、全拼音形编码、简拼音形编码、简拼形音编码、字形编码多种输入方式的汉字键盘输入系统,配备具有打字以及声母、韵母和编码字根提示功能的屏幕虚拟软键盘,其特征在于:(1)所述汉字拼音的声母以其首字母为声母代码,没有声母的汉字,以韵母的首字母为声母代码;(2)所述汉字拼音的韵母根据输入方式不同有不同的字母代码:①在全拼音形输入方式中直接以汉字拼音为汉字的拼音代码,一个汉字音节最长为六个字母代码;②全拼音形输入方式韵母中的ng以字母g为代码,一个汉字音节最长为四个字母代码;③在双拼音形输入方式中的韵母代码,由该输入方式规定每个完整的韵母以一个英文字母为代码;(3)所述字形编码字根是以文字描述汉字笔形特征的方式将汉字的编码字根进行科学的分类,从而把大量看似毫无规律的汉字字根归类整合为26个,并使之与26个英文字母按象形或意会的关系建立有理化的关联;汉字的字形编码由汉字字形的首形码、尾形码、补形码、特征码构成,其约定的意义是:首形码为汉字左上角最高的笔形特征的英文字母代码;尾形码为汉字右下角最低的笔形特征的英文字母代码;补形码为汉字右上角最高的笔形特征的英文字母代码;特征码为去掉汉字右上角所取的补形码后,对余下部分再次取补形码;汉字字形的编码字根所对应的英文字母代码如下:(4)本发明的字根体系和字根对应的英文字母代码在键盘上的布局是输入法的核心技术,对本领域普通技术人员来说,可以根据上述说明改变部分字根或变换字根所对应的英文字母代码键位,或者将其应用于其它的输入法,而所有这些改变或变换以及用于其它的输入法都应属于本发明权利要求的保护范围;(5)所述汉字字形的取码规则如下:①一个笔画或部件占用多个角位时,可以重复取同一个字母代码;②字形缺角无笔画可取时直接取字母代码A;③折笔画可以看成是由转折处断开的两个笔画组成,然后分别取各自笔形所对应的字母代码;④首、尾两处不同的字根共用同一个笔画时,可以分别取各自对应的字母代码;⑤优先取笔画多的大字根或部件的字母代码;⑥字首是草字头(艹)、气字头(气)、竹字头()、病字头(疒)覆盖的汉字,在取右上角的补形码时,应先将其移除后再取右上角的补形码,以避免与首形码取同一个字根的代码;⑦外围是“口、门”两类的汉字,在取右下角的尾形码时,改取其框内右下角的笔形编码,但在“口、门”外围有附带的笔画时,仍同一般的汉字取其右下角的笔形编码。2.根据权利要求1所述的汉字编码输入方法,双拼音形输入方式的声母、韵母在计算机通用键盘和虚拟软键盘上的布局以及单字和词组的编码方法,其特征是:(1)双拼音形输入方式以汉字声母的首字母为声母代码,没有声母的汉字,以韵母的首字母为声母代码;(2)韵母的键盘布局依据汉语拼音韵母表,将a、e、i、o、u、u等六个单韵母与键位字母A、E、I、O、U、V直接对应;i行复韵母按韵母表的顺序从英文字母键盘的第一排Q键起自左至右依序排列;a行复韵母按韵母表的顺序从英文字母键盘的第二排A键起自左至右依序排列;u行复韵母按韵母表的顺序从英文字母键盘的第三排Z键起自左至右依序排列;u行的三个复韵母按汉语拼音韵母表的书写规则与相应的u行韵母合并,其中一个复韵母ue置于英文字母P键上;双拼音形输入方式中对汉语拼音35个韵母的字母代码定义如下:(3)汉字字形的26个编码字根也按象形或相似的关系与英文字母键位作对应的有理分布,声母、韵母和编码字根在通用的PC键盘以及虚拟软键盘上的具体布局如附图2所示;(4)双拼音形输入方式中单字的编码依序取该字的声母代码、韵母代码,然后可以翻页选字输入;继续取该字左上角的首形码和右下角的尾形码,则该字自动上屏准确输入,单字编码长度最多为四个字母代码,单字编码的码元顺序为:声母代码+韵母代码+首形码+尾形码;(5)双拼音形输入方式词组编码由汉字的字音元素和字形的编码字根组成,按字音和字形的组合不同有多种编码方法,其编码长度最多为四个字母代码;二字词组:①二字词组的拼音输入方式是依序取第一个汉字的声母代码和韵母代码,然后取第二个汉字的声母代码和韵母代码;声母代码1+韵母代码1+声母代码2+韵母代码2;②二字词组的音形输入方式是取第一个汉字的声母代码和首形码,接着取第二个汉字的声母代码和首形码;声母代码1+首形码1+声母代码2+首形码2;③二字词组的字形输入方式是依序取第一个汉字的首形码和尾形码,接着取第二个汉字的首形码和尾形码;首形码1+尾形码1+首形码2+尾形码2;三字词组:①三字词组的拼音输入方式是依序取词组中每个汉字的声母代码和末字的韵母代码;声母代码1+声母代码2+声母代码3+末字韵母代码;②三字词组的音形输入方式是依序取词组中每个汉字的声母代码和末字的尾形码;声母代码1+声母代码2+声母代码3+尾形码3;③三字词组的字形输入方式是依序取词组中每个汉字的首形码和末字的尾形码;首形码1+首形码2+首形码3+尾形码3;四字和四字以上词组:①四字和四字以上词组的拼音输入方式是依序取词组中前三个字的声母和末字的声母;声母代码1+声母代码2+声母代码3+末字声母代码;②四字和四字以上词组的字形输入方式依序取词组中前三个字的首形码和末字的首形码;首形码1+首形码2+首形码3+末字首形码。3.根据权利要求1所述的汉字编码输入方法,全拼音形输入方式中的声母、韵母以及单字和词组的编码方法,其特征是:(1)全拼音形输入方式是按汉语拼音规则直接输入汉字的声母和韵母,最多六键输入一个完整的汉字音节;(2)为了使声母和韵母的拼式简短,进一步提高输入效率,汉语拼音的声母只输入其首字母,韵母中的ng用字母g替代,最多四键输入一个完整的汉字音节;(3)全拼音形编码方式的单字编码是直接输入其汉语拼音的声母、韵母,然后可以翻页选字输入;继续取该字左上角的首形码和右下角的尾形码,则该字自动上屏准确输入,单字编码的码元顺序为:声母+韵母+首形码+尾形码;(4)全拼音形输入方式词组编码由汉字的字音元素和字形的编码字根组成,其编码长度最多为六个字母代码;二字词组:按照全拼音形输入方式对声母和汉字字形的取码规则依序直接取二字词组中每个字的声母、首形码、尾形码;声母1+首形码1+尾形码1+声母2+首形码2+尾形码2;三字词组:按照全拼音形输入方式对声母和汉字字形的取码规则依序直接取三字词组中每个字的声母和首形码;声母1+首形码1+声母2+首形码2+声母3+末字首形码;四字词组:按照全拼音形输入方式对声母和汉字字形的取码规则依序直接取四字词组中每个字的声母,然后取首字的首形码和末字的尾形码;声母1+声母2+声母...

【专利技术属性】
技术研发人员:刘君度刘冰彬陈昌英
申请(专利权)人:刘君度刘冰彬陈昌英
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1