The invention discloses a Korean transliteration method and a device thereof, which belong to the field of language processing. The method comprises the following steps: will be split into several Han Wen Han Wen information, text query; phonetic segment corresponding with Han Wen characters from the font, text and phonetic correspondence between Han Wen fragments of font storage; the phonetic fragments query according to the text in the interest of Han Wen Han Wenxin in order to get information and phonetic mosaic, Han Wen the corresponding information. The corresponding relationship between the font pre stored in Korean words and phonetic segments, the phonetic query fragment corresponds to Korean character from the font, so when the Korean transliteration information including unfamiliar phrases or words or phrases from the popular network group, can inquire into phonetic segments of each of the Korean information in Korean corresponding to the characters, so as to achieve accurate phonetic, improve the accuracy of the results.
【技术实现步骤摘要】
韩文音译方法及装置
本专利技术实施例涉及语言处理领域,特别涉及一种韩文音译方法及装置。
技术介绍
音译(英文:transliteration)技术,用于将一种语言中的词汇翻译为另一种语言中与之发音相近的词汇或注音。目前使用较为广泛的韩文音译技术是基于词组库的音译技术。基于词组库的韩文音译技术的核心思想是:人工预先采集韩文中的常用词组及每个常用词组对应的注音片段序列,建立词组库;服务器对于待音译的韩文信息,进行拆分得到若干组韩文词组,对于每组韩文词组从词组库中选择出匹配度高于阈值的注音片段序列,将选择出的若干组注音片段按照韩文词组对应的顺序进行拼接,得到与输入的韩文信息对应的注音信息。由上述方法可知,词组库中存储的为韩文中的常用词组,且这些常用词组是人工进行采集的,因此该词组库并不能够涵盖韩文中所有的词组,当待音译的韩文词组在词组库中不存在时,根据匹配度选择出的注音片段序列并不是该韩文词组的准确注音,从而出现音译结果准确率低的问题。
技术实现思路
为了解决目前的韩文音译技术的音译结果准确率低的问题,本专利技术实施例提供了一种韩文音译方法及装置。所述技术方案如下:第一方面,提供了一种韩文音译方法,该方法包括:将韩文信息进行拆分,得到若干个韩文文字;从字库中查询与韩文文字对应的注音片段,字库存储有韩文文字和注音片段的对应关系;将查询到的注音片段按照韩文文字在韩文信息中的顺序进行拼接,得到与韩文信息对应的注音信息。可选地,将韩文信息进行拆分,得到若干个韩文文字,包括:检测韩文信息中相邻的两个韩文文字之间是否存在待变音的韩文文字;若存在待变音的韩文文字,则将待变音的韩文 ...
【技术保护点】
一种韩文音译方法,其特征在于,所述方法包括:将韩文信息进行拆分,得到若干个韩文文字;从字库中查询与所述韩文文字对应的注音片段,所述字库存储有所述韩文文字和所述注音片段的对应关系;将查询到的所述注音片段按照所述韩文文字在所述韩文信息中的顺序进行拼接,得到与所述韩文信息对应的注音信息。
【技术特征摘要】
1.一种韩文音译方法,其特征在于,所述方法包括:将韩文信息进行拆分,得到若干个韩文文字;从字库中查询与所述韩文文字对应的注音片段,所述字库存储有所述韩文文字和所述注音片段的对应关系;将查询到的所述注音片段按照所述韩文文字在所述韩文信息中的顺序进行拼接,得到与所述韩文信息对应的注音信息。2.根据权利要求1所述的方法,其特征在于,所述将韩文信息进行拆分,得到若干个韩文文字,包括:检测所述韩文信息中相邻的两个韩文文字之间是否存在待变音的韩文文字;若存在所述待变音的韩文文字,则将所述待变音的韩文文字替换为变音后的韩文文字;根据所述变音后的韩文文字得到与所述韩文信息对应的若干个韩文文字。3.根据权利要求2所述的方法,其特征在于,所述检测所述韩文信息中相邻的两个韩文文字之间是否存在待变音的韩文文字,包括:以预定标识作为拆分位置,将所述韩文信息拆分为若干组韩文词组;所述预定标识包括空格符号和标点符号中的至少一种;检测所述韩文词组中相连的两个韩文文字之间是否存在待变音的韩文文字。4.根据权利要求3所述的方法,其特征在于,所述检测所述韩文词组中相连的两个韩文文字之间是否存在待变音的韩文文字,包括:获取第一韩文文字的第一单音节序列和第二韩文文字的第二单音节序列,所述第一韩文文字和所述第二韩文文字是所述韩文词组中相邻的两个韩文文字;提取所述第一单音节序列的尾部音节和所述第二单音节序列的首部音节;检测所述尾部音节和所述首部音节是否属于变音音节组合;若所述尾部音节和所述首部音节属于所述变音音节组合,则确定存在所述待变音的韩文文字。5.根据权利要求4所述的方法,其特征在于,所述将所述待变音的韩文文字替换为变音后的韩文文字,包括:当所述第一韩文文字是所述待变音的韩文文字时,对所述第一单音节序列的尾部音节进行变音,根据变音后的所述第一单音节序列重新组合出第三韩文文字,使用所述第三韩文文字替换所述第一韩文文字;和/或,当所述第二韩文文字是所述待变音的韩文文字时,对所述第二单音节序列的首部音节进行变音,根据变音后的所述第二单音节序列重新组合出第四韩文文字,使用所述第四韩文文字替换所述第二韩文文字。6.一种韩文音译装置,其特征在于,所述装置包括...
【专利技术属性】
技术研发人员:陶县俊,邱宇扬,黄卓腾,姜宁,
申请(专利权)人:广州酷狗计算机科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。