汉字两分表示法及输入法制造技术

技术编号：2836768 阅读：275 留言：0更新日期：2012-04-11 18:40

一种汉字编码系统及输入方法，适用于大字库中的汉字输入，用常用字（国家标准中的常用字）、常用偏旁部首及基本笔画作为常用字元集，将汉字拆分成两个部分，以其中最大常用字元分别作为两部分的表示符，以两个表示符表示一个汉字。键盘输入汉字时，输入其中两个部分表示符的音码（包括全拼码、双拼码、注音码），鼠标及光笔输入时输入屏幕上提示的两个表示符，排序时以表示符的音码排序。

全部详细技术资料下载

【技术实现步骤摘要】

中文信息处理及汉字输入。
技术介绍
汉字输入主要分三大类形码输入、音码输入、音型结合输入。本专利技术是在“汉字析音编码及输入方法”(专利号92113155.0，以下简称“析音码”)基础上的改进和创新，是析音码的第二种方案。属于音型结合类。本专利技术采用析音码的汉字结构分类及拆分方法(包括首部正向取大原则、尾部逆向取大原则)，并稍加改进。然后提取常见字元作为拆分后首尾两个部分的表示符作为汉字输入和排序的基础。析音码由四码组成，前两码是汉字的双拼码，后两码是汉字拆分成首尾两个部分后的声母码，其中双拼码需要一定的记忆，并且需要知道该字的读音，对于超大字库中的许多难认字和偏僻字，就难以输入了，虽然析音码中有难认字输入法，但由于仅采用首尾两部声母编码，对于数万乃至十多万的汉字来说，重码率极高。析音码中虽然制订了拆分原则，和以声代形编码方法，其取大原则是无限取大，只要拆分后的部分是汉字，则取其声母作为编码。然而，对于超大字库来说，汉字拆分后的部分绝大多数仍然是汉字，而且很可能是普通人不认识的汉字，或者是普通人不知道是汉字的汉字，如“部”字拆分成“咅”和“阝”，析音码说明书中认为“咅”不是字，这是不正确的，如果要取大就必须取“咅”编码，普通人不认识“咅”，自然取“立”，而对于认识“咅”的人则会取“咅”，这样取码具有较大的歧义。本专利技术以常用字(国家标准中的常用字)、常用偏旁部首及基本笔画作为常用字元集，只提取常用字元作为首尾两部的表示符，解决了汉字拆分成两个部分后难认的问题；同时也解决了难认字的输入问题，由于是两个部分的完全音码，对于超大字库而言，其重码率也相对较...

【技术保护点】
一种汉字编码系统及输入方法。其特征在于：以常用字（国家标准中的常用字）、常用偏旁部首及基本笔画作为字元集，将汉字一分二，从汉字两部分（称之为首部和尾部）中提取最大常用字元作为该两个部分的表示符，首部按书写顺序正向取大原则提取，尾部按逆向取大原则提取，每个汉字均由两个表示符表示。结构为独体和三部分以上的汉字均按两个部分看待。

【技术特征摘要】
1.以常用字(国家标准中的常用字)、常用偏旁部首及基本笔画作为字元集，将汉字一分二，从汉字两部分(称之为首部和尾部)中提取最大常用字元作为该两个部分的表示符，首部按书写顺序正向取大原则提取，尾部按逆向取大原则提取，每个汉字均由两个表示符表示。结构为独体和三部分以...

【专利技术属性】
技术研发人员：叶星遥，
申请(专利权)人：叶星遥，
类型：发明
国别省市：31[]

全部详细技术资料下载我是这个专利的主人