基于嵌入式系统的哈萨克文连写判断与存储方法技术方案

技术编号:10943763 阅读:107 留言:0更新日期:2015-01-22 20:14
本发明专利技术公开了基于嵌入式系统的哈萨克文连写判断与存储方法,①根据哈萨克文语言特点,以哈萨克文unicode扩展码为基础,使哈萨克文词头、词中、词尾各自构成字符集而且其在词头,词中和词尾位置的不同及字形的变化并根据判断是否是词的前连,后连,中间(即前后连)或单独一个词,进行变形;②设计了一种字库提取方法,以标准8×16字库为基准,取出智能终端界面显示实际用到的哈萨克文字,将其生成一个新的精简哈萨克文字库。

【技术实现步骤摘要】

本专利技术涉及语言软处理技术,特别是基于嵌入式系统的哈萨克文连写判断与存储方法
技术介绍
近年来,随着少数民族信息化以及自动化领域的发展,在新疆基于嵌入式系统的智能设备在少数民族中也有了比较广泛的应用,但各地区、各民族之间的文化水平差异较大,使为达到少数民族用户充分应用智能终端设备的目标很难被实现。
技术实现思路
本专利技术的目的在于提供一种基于嵌入式系统的哈萨克文连写判断与存储方法,能解决当今哈萨克语输入效率慢、存储速率慢,所需存储空间大的问题,并研发出根据适用于哈萨克文语言特点的拼写和存储方法。本专利技术的目的是这样实现的:一种基于嵌入式系统的哈萨克文连写判断与存储方法,①根据哈萨克文语言特点,以哈萨克文unicode扩展码为基础,使哈萨克文词头、词中、词尾各自构成字符集而且其在词头,词中和词尾位置的不同及字形的变化并根据判断是否是词的前连,后连,中间(即前后连)或单独一个词,进行变形;②设计了一种字库提取方法,以标准8×16字库为基准,取出智能终端界面显示实际用到的哈萨克文字,将其生成一个新的精简哈萨克文字库。本专利技术能解决当今哈萨克语输入效率慢、存储速率慢,所需存储空间大的问题,并研发出根据适用于哈萨克文语言特点的拼写和存储方法。附图说明下面将结合附图对本专利技术作进一步说明。图1为本专利技术的工作流程图。具体实施方式一种基于嵌入式系统的哈萨克文连写判断与存储方法,如图1所示,①根据哈萨克文语言特点,以哈萨克文unicode扩展码为基础,使哈萨克文词头、词中、词尾各自构成字符集而且根据判断是否是词的前连,后连,中间(即前后连)或单还是独一个词,相应对其进行变形;②以标准8×16字库为基准,取出智能终端界面显示实际用到的哈萨克文字,将其生成一个新的精简哈萨克文字库。本专利技术仍然遵循哈萨克文变形规则。哈萨克文变形规则为:哈萨克文字属于阿拉伯文字系列,阿拉伯文字在伊斯兰教的影响下流传很广。波斯文,乌尔都文以及我国的新疆的哈萨克、柯尔克孜文等多种文字采用阿拉伯字母。哈萨克文的字母没有大写和小写的区分,但有印刷体和书写体的区别,而且除去五个字母以外,其他29个字母都可以和后面的字母连写,而且因其在词头,词中和词尾的位置不同,字形也有所变化。哈萨克文字的书写方向和中文不同,它是自右向左横着写,因此,哈萨克文书籍和本子都是右开本的。在换行的时候,一般的,我们需要判断一下是否是整个词,进行整个词的换行,而不能把词拆成两个部分。哈萨克文里面的数字仍然采用从左往右的显示方式。因此,哈萨克文单词分段法可分成first、last、middle及alone,并根据判断是否是词的前连(前面字符在集合1中),后连(后面字符在集合2中),中间(即前后连,前面字符在集合1中,后面字符在集合2中)或还是单独一个词,进行相应变形。根据上述分析,给出变形的数组:分别对应上面的情况。对于其它不在数组中的,其变形和自身相同,具体判断方法如下例:const WORD Arbic_Position[][4]=//first,last,middle,alone{{0xfe90,0xfe91,0xfe92,0xfe8f本文档来自技高网...

【技术保护点】
一种基于嵌入式系统的哈萨克文连写判断与存储方法,其特征在于:①根据哈萨克文语言特点,以哈萨克文unicode扩展码为基础,使哈萨克文词头、词中、词尾各自构成字符集而且根据判断是否是词的前连,后连,中间(即前后连)或单还是独一个词,相应对其进行变形;②以标准8×16字库为基准,取出智能终端界面显示实际用到的哈萨克文字,将其生成一个新的精简哈萨克文字库。

【技术特征摘要】
1.一种基于嵌入式系统的哈萨克文连写判断与存储方法,其特征在于:①根据哈萨克文语言特点,以哈萨克文unicode扩展码为基础,使哈萨克文词头、词中、词尾各自构成字符集而且根据判断是否...

【专利技术属性】
技术研发人员:柴雨峰李满树杨志杰汪振东倪凯峰塔拉甫·加盘
申请(专利权)人:新疆信息产业有限责任公司
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1