本发明专利技术,提高四一七条码编码中日韩文字符效率的方法,其主题涉及一种编码/解码中日韩文的四一七条码设备及控制程序的技术、方法。本发明专利技术的方法通过模式控制、语言及主题控制、基于语言及主题的压缩编码、以及漂移码等技术,提高四一七条码编码中日韩文字符的效率,如汉字的编码效率从平均每码字0.3-0.6个中文字到0.8-0.9个中文字;从而增加四一七条码的中日韩文编码容量,如单个四一七条码编码汉字的容量从500左右增加到高达900左右。该方法适用于需编码中文的各类证卡系统(特别是需要GB18030支持的系统)、以及金融、海关、工商、税务等报表管理系统。(*该技术在2022年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术专利申请的主题涉及一种编码/解码中日韩文的四一七条码设备,包括一个在公知的存储器中存储有中日韩文字符流、四一七条码原始码字或条码的计算机,所述的计算机在中日韩文编码/解码程序的控制下对中日韩文字符流进行压缩编码处理并生成四一七条码原始码字或条码,或对编码结果进行逆向解码处理,从而提高四一七条码编码中日韩文的效率和容量。2.
技术介绍
四一七条码(PDF417)是一种高容量二维条码技术的国际标准,该标准在中国对应的是国标《四一七条码》(中华人民共和国国家标准《四一七条码》GB/T17172-1997,1997)。在国际上,四一七条码已被广泛应用于身份证、驾驶证、军人证、选民证、社会福利卡等各类证卡系统以及金融、海关、工商、税务等报表管理系统;在交通、运输、能源、制造业、医疗卫生及后勤管理等领域也有着广泛的应用。随着我国经济的快速发展,四一七条码技术正以其成本低廉、保密防伪能力强、便于计算机自动录入等优点在我国得到愈来愈广泛的应用。四一七条码定义了三种压缩(Compact)模式,即文本压缩模式、数字压缩模式和字节压缩模式。文本压缩模式定义英文字母字符的压缩方法,一个四一七条码通常可以容纳1848个英文字母字符;数字压缩模式定义阿拉伯数字字符的压缩方法,一个四一七条码通常可以容纳2729个阿拉伯数字字符;字节压缩模式定义对信息源以字节方式进行压缩处理,一个四一七条码通常可以容纳大约1100字节。GB18030是2000年3月17日发布并强制执行的中文信息处理标准。该标准包含单字节,双字节和四字节的编码,涵盖简繁体中文、日文和韩文以及少数民族字符。为彻底解决邮政、户政、金融、地理信息系统和证件(如身份证、学生证、驾驶证等)的管理等迫切需要的人名、地名用字问题提供了解决方案。尽管该标准强制执行的范围不包括嵌入式系统和条码系统,但是考虑到四一七条码会经常用于邮政及证件管理,对GB18030更好的支持会进一步推广四一七条码的应用。现有的四一七条码中文处理技术一般将中文按字节压缩模式进进行处理。在该模式下,对于双字节的汉字字符集,如GB2312、GBK或GB13000,平均每码字(四一七条码的编码单位)大约可编码1.2个字节,一个四一七条码大约可编码500个汉字信息(http//www.symbol-china.com/2d/technology/technology.htm)。在现有的技术模式下,双字节中文字符的编码效率(平均每个码字可编码的中文字符)为0.6;处理四字节的GB18030字符时,其编码效率则是0.3。3.
技术实现思路
3.1本专利技术所要解决的技术问题本专利技术要解决的问题是,通过适当的计算机信息技术处理方法来提高四一七条码对中日韩文的编码效率,从而使四一七条码能更好地支持GB18030字符集。注本专利技术中,编码效率是指平均每个四一七条码码字可编码的中日韩文字符的数目。3.2本专利技术所使用的技术手段为了提高四一七条码对中日韩文的编码效率,本专利技术采用了如下的技术手段(1)远东语言模式切换控制技术;(2)语言及主题亚模式控制技术;(3)单码字压缩编码技术;(4)双、三码字漂移控制技术。注国际上通常用远东语言通指中日韩文。3.2.1远东语言模式切换控制技术本专利技术引用一个标准四一七条码定义的保留控制码作为远东语言模式切换控制码。该控制码的主要功能是,从任意其他的压缩模式(从文本、数字或字节压缩模式)切换到本专利技术所定义的远东语言压缩模式。其主要特征有(1)在同一四一七条码中可以多次出现;(2)任何其它控制码可中止当前模式。3.2.2语言及主题亚模式控制技术本专利技术定义了语言及主题亚模式控制码及其控制技术。在四一七条码中,该亚模式控制码紧随第一个远东语言模式切换控制码,用于确定该四一七条码内容的语言、主题,从而确定其编码与解码的方法。一个包含远东语言模式切换控制码的四一七条码,包括宏四一七条码,有且只有一个语言及主题亚模式控制码,即紧随第一个远东语言模式切换控制码的码字。如果有第二个或更多的远东语言模式切换控制码出现在同一个四一七条码,其语言及主题亚模式不变,换言之,第二个或更多的远东语言模式切换控制码后的不是语言及主题亚模式控制码。3.2.3单码字压缩编码技术本专利技术采用单码字压缩编码技术对远东语言进行压缩编码。一个特定的语言及主题亚模式有一个对应的高频字的压缩编码表;在该亚模式下,所有在该压缩编码表的文字、符号都采用单码字编码。3.2.4双、三码字漂移控制技术在某一亚模式下,对不在对应的压缩编码表的远东语言字符,本专利技术采用漂移控制技术进行编码。具体而言,对远东语言字符,单、双或四字节的内码转换成四一七条码码字时,若其内码不在对应的压缩编码表,则采用漂移码+编码的双码字编码或则采用漂移码+编码+编码的三码字方法。3.3远东字符信息的计算机技术处理过程本专利技术所定义的对远东字符信息计算机技术处理过程包括远东字符流编码过程和逆向解码过程。在本专利技术技术定义下,四一七条码对阿拉伯数字字符(数字压缩模式)和字节(字节压缩模式),使用国家标准定义的方法处理。在远东语言模式下,对英文字母字符的压缩方法,做如下修改1)对于远东字符间的单个英文字母字符,采用本专利技术定义的压缩模式;2)对于两个或以上的英文字母字符,使用国家标准定义的方法处理,即通过文本压缩切换控制码(900),进入标准的文本压缩模式。例如对符号串“本专利技术完成于2002年5月1日”中,对“2002”采用标准的文本压缩模式,而对“5”则采用本专利技术定义的压缩模式。3.4专利技术取得的效果及展望本专利技术的技术可以提高四一七条码中文字符的编码效率,从每码字0.3-0.6个中文字到0.8-0.9个中文字;从而将四一七条码约500左右汉字的中文编码容量提高到高达900字左右。本专利技术能提高四一七条码的中文编码容量,为四一七条码的应用提供了有力的支持。进一步的工作将是建立各种主题的高频字的标准压缩编码;建立并完善压缩编码表的建立、发表及维护机制;同时希望建立四一七条码的附加国家标准以推动国民经济的发展。4.技术处理过程流程图说明4.1编码流程图(A)(见说明书附附图说明图1)远东字符流编码过程指的是,利用公知的计算机将远东字符流转换成四一七条码码字或四一七条码的过程。该过程描述如下初始化过程(①)设定该条码的语言及主题环境,以及压缩编码的方法。通过读取字符过程(②)反复读取单、双、四字节的远东字符内码后;判定是否为连续单字节字符串的过程(③)预读下一字符并判定是否为连续的单字节字符(英文),如果是,则切换到标准文本编码(⑨);否则对该字符进行远东字符编码;编码过程首先初始化设定的压缩编码方法,判定该字符是否为单码字压缩编码(④);如果是,则计算并获取单码字编码(⑤);否则,计算多码字编码的漂移码和编码(⑥);然后对编码的结果进行输出(⑦),根据适当的条件输出模式控制码、亚模式控制码、编码和漂移码,并设定适当的标志;最后判定是否结束过程(⑧)决定是否终止编码或反复执行读取、编码过程。4.2解码流程图(B)(见说明书附图2)远东字符流解码过程指的是,利用公知的计算机,将四一七条码码字(原始解码结果),转换成远东字符内码的过程。该过程描述如下首先,通过读取码字的过程(①)读取码字;当判定(本文档来自技高网...
【技术保护点】
一种根据语言与主题环境压缩编码中文、日文和(或)韩文的,适用于四一七条码的计算机信息处理的方法,包括:用于远东语言控制的步骤;用于控制语言及主题环境的步骤;用于转化中文、日文和(或)韩文内码到四一七条码码字的步骤;用于将四一 七条码码字还原到的中文、日文和(或)韩文内码步骤。
【技术特征摘要】
【专利技术属性】
技术研发人员:陆柏芳,陈克,杜春蕾,
申请(专利权)人:陆柏芳,陈克,杜春蕾,
类型:发明
国别省市:11[中国|北京]