一种基于文法向量乘法的藏文音节校对方法技术

技术编号：31580064 阅读：27 留言：0更新日期：2021-12-25 11:23

本发明专利技术公开了一种基于文法向量乘法的藏文音节校对方法，属于藏文信息处理技术领域，本发明专利技术通过将藏文音节进行数据格式转换，得到Unicode编码格式的藏文音节序列，并将藏文音节序列进行标记，将标记后的藏文音节通过判断其是否符合藏文音节的语法，建立4个文法规范向量M1、M2、M3和M4，再通过向量乘法去计算新的向量M，仅需将向量M与初始向量M0进行比较，即可得出原藏文音节序列是否符合规范，向量M与初始向量M0元素不一样的位置即为不符合语法规范的位置，即可明确得出语法出错的具体位置，本发明专利技术设计的藏文音节校对方法，方案简单，可有效解决长期困扰藏文音节校对的困难。可有效解决长期困扰藏文音节校对的困难。可有效解决长期困扰藏文音节校对的困难。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文法向量乘法的藏文音节校对方法

[0001]本专利技术属于藏文信息处理
，具体涉及一种基于文法向量乘法的藏文音节校对方法。

技术介绍

[0002]目前，英文文本校对技术取得了大的成果,部分成果实现了商品化。国内在文本校对方面的研究始于九十年代初期,但发展速度较快，其中藏文字的校对主要方法采用字典匹配的方法进行。2013年安见才让等人在《中文信息学报》上刊登的《基于分段的藏字校对算法研究》详细描述了藏文的文法以及根据藏文文法提出了基于分段的藏文校对方法。但目前藏文音节的校对方法都比较复杂，把藏文文法中的多个规范混在一起进行处理，难于理解和实现藏文音节的校对。

技术实现思路

[0003]针对现有技术中的上述不足，本专利技术提供的一种基于文法向量乘法的藏文音节校对方法解决了现有藏文音节的校对方法都比较复杂，把藏文文法中的多个规范混在一起进行处理，存在难于理解和实现的问题。
[0004]为了达到上述专利技术目的，本专利技术采用的技术方案为：一种基于文法向量乘法的藏文音节校对方法，包括以下步骤：
[0005]S1、对等待校对的藏文音节进行数据格式转换，将其数据转换为Unicode编码格式，得到藏文音节序列；
[0006]S2、将藏文音节序列根据其构件拆分成七个元素，将七个元素按先后顺序标记为t5、t4、t6、t3、t2、t1、t0；
[0007]S3、根据t5、t6，建立第一向量M1；
[0008]S4、根据t4、t6、t3，建立第二向量M2；
[0...

【技术保护点】

【技术特征摘要】
1.一种基于文法向量乘法的藏文音节校对方法，其特征在于，包括以下步骤：S1、对等待校对的藏文音节进行数据格式转换，将其数据转换为Unicode编码格式，得到藏文音节序列；S2、将藏文音节序列根据其构件拆分成七个元素，将七个元素按先后顺序标记为t5、t4、t6、t3、t2、t1、t0；S3、根据t5、t6，建立第一向量M1；S4、根据t4、t6、t3，建立第二向量M2；S5、根据t2，建立第三向量M3；S6、根据t1、t0，建立第四向量M4；S7、根据初始向量M0、第一向量M1、第二向量M2、第三向量M3和第四向量M4，通过向量乘法，得到向量M，其中，初始向量M0＝(1，1，1，1，1，1，1)；S8、判断向量M是否等于初始向量M0，若是，则跳转至步骤S9，若否，则跳转至步骤S10；S9、得出并保存“该等待校对的藏文音节符合藏文音节文法”的结论，结束；S10、得出并保存“该等待校对的藏文音节不符合藏文音节文法”的结论，结束。2.根据权利要求1所述的基于文法向量乘法的藏文音节校对方法，其特征在于，所述步骤S3包括以下分步骤：S31、对第一向量M1的全部元素赋1；S32、判断元素t5、t6是否在集合S
R1
中，若是，则无需再赋值，若否，则赋值第一向量M1的第一和第三个元素为0，其中，第一和第三个元素为0...

【专利技术属性】
技术研发人员：安见才让，孙琦龙，
申请(专利权)人：青海民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人