基于笔段网格的手写汉字输入方法和汉字识别方法技术

技术编号：2945390 阅读：322 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于笔段网格的汉字字形信息表示方法、手写汉字输入法和无需训练的汉字识别法。汉字字形信息表示方法是设定一个由Ｎ×Ｎ个小矩形组成的笔段网格，笔段具有有线或无线两种状态，有线状态笔段的集合表示一个字形。输入方法是在笔段网格中描画笔段，计算机获取所有描画过的笔段并将其状态标为有线。识别方法是：输入待识汉字的笔段网格字形，将它与比对汉字信息库中每个汉字的笔段网格字形进行基本笔画和复合笔画的配对，获得最优的笔画配对方式，计算出距离，把距离最小的前Ｍ个比对网格字形作为候选识别结果输出，供输入者选定。本发明专利技术的方法可以按原貌输入和识别各种汉字，包括错字、异体字等，促进汉字的教学和研究。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于笔段网格的汉字字形表示方法、手写汉字输入方法及汉字识别方法，无需事先学习训练、无论该字书写是否正确，均可按书写原貌将汉字输入到计算机内并被计算机识别。本专利技术属于模式识别、人工智能和汉字信息处理
技术背景随着中国经济的飞速发展，对外经济、文化交流的不断深入，越来越多的外国人对中文感兴趣，学习中文。在汉语教学的过程中，外国留学生迫切地需要一种无需训练、无需辨析汉字结构、无需知道读音即可使用的计算机汉字输入法。目前的汉字输入方法主要有拼音输入法、字形输入法和手写输入法。拼音输入法要求输入者必须能够准确地拼出要输入字的拼音；字形输入法要求输入者必须熟练地掌握五笔字形或其他某一种字形规则；手写输入法要求使用者必须能够正确理解汉字字形结构而且书写要比较规范，否则计算机无法识别。因此，目前这三种汉字输入方法都不适合外国留学生使用。此外，汉语教师迫切需要一种汉字字形处理工具，能将外国人写的正字和错字按原貌输入计算机，让计算机对字形书写错误进行错误自动判断、检索和定量分析，对错字和正字、错字和错字、正字和正字进行字形相似度的自动比对，目前还没有这样一种工具。再者，在古籍汉字的历史文化研究过程中，需要将古籍整理成各种电子或网络出版物。在将古籍汉字录入到计算机内时，许多异体字在计算机的字符集内没有，目前的办法是用一些通用字、规范字来代替。这样做虽然保留了古籍的内容信息，但是丧失了很多字形原貌信息，不利于古籍汉字的历史文化研究。所以，需要一种汉字输入方法，可以使输入者把古籍汉字的字形按原貌直接进行录入，并需...

【技术保护点】
一种基于笔段网格的汉字字形表示方法，其特征在于：该方法包括以下步骤：步骤１：首先，设定一个大矩形区域，将该矩形区域划分为大小相等的Ｎ×Ｎ个小矩形区域；步骤２：在每个小矩形区域内，设定笔段，构成用来描画汉字的笔段网格；步骤３：将笔段网格内的笔段设定为有线笔段状态和无线笔段状态；该笔段被描画过，则为有线状态；没有被描画过，则为无线状态；步骤４：通过有线笔段集合表示汉字的字形。

【技术特征摘要】

【专利技术属性】
技术研发人员：宋柔，林民，
申请(专利权)人：北京语言大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人