文字信息生成方法和系统技术方案

技术编号:12542958 阅读:53 留言:0更新日期:2015-12-19 11:23
本发明专利技术涉及一种文字信息生成方法,其方法包括步骤:获取原始文字信息,读取所述原始文字信息中的原始汉字;获取所述原始汉字的第一汉语拼音,根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音;根据所述第二汉语拼音获取目标汉字,根据所述目标汉字生成目标文字信息;采用本发明专利技术方案,可以自动生成趣味性的文字信息,且该文字信息的生成效率高。

【技术实现步骤摘要】

本专利技术涉及信息处理
,特别是涉及一种文字信息生成方法和系统
技术介绍
随着智能终端的普及与发展,手机等移动智能终端已经成为人们随身携带的通信工具,功能也越来越完备。人们在使用移动智能终端时除了传统的通讯需求,在日常工作生活中,还离不开装载在移动智能终端中的众多终端应用(如,地图,导航,天气、微博、微信、邮件、短信等应用)。在这些终端应用中,很多是具有文字编辑功能的,依赖于文字编辑功能,人们可以编辑文字信息以用于与其他人进行沟通或者分享给其他人一些文字信息。—般情况下,对于使用中文的一些人群往往是需要编辑出正常语音的中文信息,正常语音的中文信息便于其他人对信息的理解。然而,由于按照正常语音编辑的中文信息,形式较单一,往往不满足另外一些人群的需求,这些人群往往喜欢编辑较为特殊的文字信息,如喜欢编辑趣味性比较强的信息的人群。例如,在日常生活中,我们经常会遇到很多b、P不分,n、I不分的人,无论是年龄小的还是年纪大的都存在这种情况,如把“乒乒球”说成“冰帮球”,这种发音的差异常常给我们带来很多乐趣。用户若想编辑这样的具有趣味性的文字信息,一方面,由于这种异常读音构成的词条往往是传统的输入方法里不存在的,需要用户输入该词条完整的汉语拼音,另一方面,用户需要考虑每个汉字或者词条的对应的趣味性的读音是什么,无论哪一方面,都比较耗费时间,会降低信息的生成效率。
技术实现思路
本专利技术的目的在于提供文字信息生成方法和系统,可以自动生成趣味性的文字信息,且该文字信息的生成效率高。本专利技术的目的通过如下技术方案实现:—种文字信息生成方法,包括如下步骤:获取原始文字信息,读取所述原始文字信息中的原始汉字;获取所述原始汉字的第一汉语拼音,根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音;根据所述第二汉语拼音获取目标汉字,根据所述目标汉字生成目标文字信息。一种文字信息生成系统,包括:读取模块,用于获取原始文字信息,读取所述原始文字信息中的原始汉字;获取模块,用于获取所述原始汉字的第一汉语拼音,根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音;生成模块,用于根据所述第二汉语拼音获取目标汉字,根据所述目标汉字生成目标文字信息。根据上述本专利技术的方案,其是获取原始文字信息,读取所述原始文字信息中的原始汉字,获取所述原始汉字的第一汉语拼音,根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音,根据所述第二汉语拼音获取目标汉字,根据所述目标汉字生成目标文字信息,由于是根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音,并根据该第二汉语拼音获取目标汉字,根据该目标汉字生成目标文字信息,因此,可以将原始文字信息中的汉字转换成对应的异常读音的汉字,再基于转换后汉字得到目标文字信息,可以自动的生成趣味性的文字信息,且该文字信息的生成效率高。【附图说明】图1为本专利技术的文字信息生成方法实施例的流程示意图;图2为本专利技术的文字信息生成系统的一个实施例的结构示意图;图3为本专利技术的文字信息生成系统的另一个实施例的结构示意图。【具体实施方式】为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的【具体实施方式】仅仅用以解释本专利技术,并不限定本专利技术的保护范围。在下述说明中,首先针对本专利技术的文字信息生成方法的实施例进行说明,再对本专利技术的文字信息生成系统的各实施例进行说明。参见图1所示,为本专利技术的文字信息生成方法实施例的流程示意图。如图1所示,本实施例中的文字信息生成方法包括如下步骤:步骤SlOl:获取原始文字信息,读取所述原始文字信息中的原始汉字;这里,原始文字信息可以是用户手动输入的,也可以是用户复制的其他地方的,还可以是通过其他方式识别到的(例如语言识别);步骤S102:获取所述原始汉字的第一汉语拼音,根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音;这里,原始汉字的读音为第一汉语拼音,第一类型汉语拼音可以包括正常发音的汉语拼音,第二类型汉语拼音可以包括异常发音的汉语拼音;根据所述关联关系确定所述第一汉语拼音关联的第二汉语拼音的过程,具体可以是:首先在第一类型汉语拼音查找到所述第一汉语拼音,再根据所述关联关系查询与该第一汉语拼音关联的第二汉语拼音;在其中一个实施例中,所述关联关系可以包括一张哈希表,本专利技术的文字信息生成方法还可以包括所述哈希表的建立过程,具体是:生成二维字符串数组,其中,所述二维字符串数组的第一维存储所述第一类型汉语拼音对应的字符串,所述二维字符串数组的第二维存储所述第二类型汉语拼音对应的字符串,所述第一类型汉语拼音包括正常发音的汉语拼音,所述第二类型汉语拼音包括异常发音的汉语拼音;根据所述二维字符串数组构造哈希表;具体地,如:private static final StringPINYIN_TO_YICHANG_TABLE = {{" biao"," piao" },{" bing"," ping" },{" niu"," liu" },.........};需要说明的是,建立所述关联关系的方式,不限于采用上述建立哈希表的方式,但在采用哈希表获取第二汉语拼音的方式,可以提高效率;在其中一个实施例中,上述所述获取所述原始汉字的第一汉语拼音的过程可以包括步骤:调用预设的用于获取汉语拼音的程序接口执行所述获取所述原始汉字的第一汉语拼音的过程,采用本实施例中的获取第一汉语拼音的方式,是考虑到在现有的终端系统中往往具有获取汉语拼音的程序接口,例如,Andro i d系统的WordQuery.queryffordlnfo (letter).getffholePinyinStr O,采用这种方式,可以直接调用现有接口,事实现方式更加简捷;此外,考虑到汉语中经常会存在一字多音的情况,例如“行”具有“hang” “xing”两个读音,为了便于确定原始汉字在原始文字信息的正确读音,在其中一个实施例中,所述获取所述原始汉字的第一汉语拼音的过程可以包括步骤:判断所述原始汉字是否包括多个汉语拼音;若是,根据所述原始汉字之前或者之后的至少一个汉字确定所述原始汉字所在的词条;根据所述词条获取所述原始汉字的第一汉语拼音,例如,根据“行”字之后一个汉字确定“行”所在的词条为“行走”,则可以根据“行走”确定当前的“行”的第一汉语拼音为“xing”,根据“行”字之前一个汉字确定“行”所在的词条为“银行”,则可以根据“银行”确定当前的“行”的第一汉语拼音为“hang” ;步骤S103:根据所述第二汉语拼音获取目标汉字,根据所述目标汉字生成目标文字信息;考虑到一个汉语拼音经常会对应多个汉字,例如“liu”,对应着“刘”、“流”、“留”等,针对这种情况,为了便于确定出所述目标汉字,在其中一个实施例中,所述根据所述第二汉语拼音获取目标汉字的过程可以包括步骤:根据所述第二汉语拼音获取汉语拼音为所述第二汉语拼音的各汉字;根据所述汉语拼音为所述第二汉语拼音的各汉字的使用频率或者使用次本文档来自技高网...
文字信息生成方法和系统

【技术保护点】
一种文字信息生成方法,其特征在于,包括如下步骤:获取原始文字信息,读取所述原始文字信息中的原始汉字;获取所述原始汉字的第一汉语拼音,根据预设的第一类型汉语拼音与第二类型汉语拼音的关联关系,确定所述第一汉语拼音关联的第二汉语拼音;根据所述第二汉语拼音获取目标汉字,根据所述目标汉字生成目标文字信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄地丹
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1