汉字变换装置制造方法及图纸

技术编号:2892010 阅读:310 留言:0更新日期:2012-04-11 18:40
汉字变换装置。其输入部从输入标音字符串截出相应词态素读音码送至辞典检索部。辞典使用记录部分别对各辞典记录使用次数。辞典选择部让使用次数多的辞典优先检索。辞典检索部以截出读音码为检索码并按优先顺序检出相应的所有同音字、候选词。由文字变换部将它们显示于显示部,供使用者确认正确的变换并把登记有认为正确的字、词的辞典的编码送至辞典管理部。辞典管理部据此更新辞典使用记录部。从而能恰当选择辞典。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字变换装置,特别是关于按照输入文件正确选择基本辞典和多个专业辞典。为了用以往技术、实施例等说明本专利技术,先对重要的单词、用语等进行说明、定义。本专利技术的主要对象是中文文字处理器、日文文字处理器等文字变换装置。因此,本专利技术说明书中所述的由使用者或应用业务程序等所输入的作为汉字变换对象的“标音字符”,除罗马字母那样的纯粹标音字符外,当然还包括像日文中假名那样的音素字符,另外还包括阿拉伯数字那样的表意文字的字符,还有朝鲜语中的谚文(朝鲜文字)、中文中的字音记号,例如类似音调记号“-”、“/”、“V”、“\”的记号(这些在电子信息处理系统的输入中以类似记号代用)。而且,作为汉字变换结果的“汉字”不仅包括如“法”、“特许法”的纯粹汉字、较确切地只由“表意文字”、汉字构成的单词,不用说还包括如“爱する”等汉字与假名混和的单词、句节,此外,还包括“々(のま)”等记号。关于说明中常使用如“标音字符串”等词汇中出现的“串”这样的汉字,由于实际上常常是即使一个汉字也用多个标音字符指定变换对象,而且考虑到变换结果是多个汉字的情况为多,所以不特别限定为复数。即,也包含单个的情况。还有,“语”“词”等也往往由独一文字构成。至于“专业辞典”中的“专业”的概念,可以说是“相互关连的单词、句子等的统称”,不仅包括“佛教”、“共产主义”、“法律”、“军事”“外交”等学术或者实际业务方面的分类,还包括“明代”、“汉代”、“周以前”等时代的划分、“北京话”、“上海话”、“日语”、“朝鲜语”等语言的区分、以及“姓名”、“艺人”、“中文化的外语”等特殊区分。汉字读音的输入方式,例如通过键盘输入表示汉字读音的标音字符,对照辞典进行词态素的读音码截出和文字变换处理,再将输入的标音字符串变换成文字串。然而,在词典中含许多字、语的情况下,词态素的读音码的截出容易搞错,会因同音字、语增加和辞典检索速度降低而降低汉字变换的效率。因此,一般将辞典分为收存(在收集基础上,存贮成可利用状态)日常的一般性单词的基本辞典和收存各专业所使用的单词的专业辞典。这种情况下,使用者就可以根据想要输入的文件的专业选择专业辞典。可是,当想输入的文件跨及几个专业时,使用者需经常转换专业辞典,因此输入效率变差。以往,具有这种转换专业辞典功能的汉字变换装置有日本特许公开号平4-80863号公开的装置。图5为这种汉字变换装置一例的结构图。该图中,1为输入部、2为控制部、3为显示部、4为文本缓冲器、5为字符变换部、6为辞典检索部、70为基本辞典、71-7n为专业辞典、8为辞典选择顺序指定部、91及92为辞典群保持部。辞典群保持部91、92按照与使用者编制的文件内容对应的检索顺序保持基本辞典70和多个专业辞典71-7n。输入部1具有输入假名字符串等、或在假名汉字变换时进行切换辞典群保持部91、92的操作的键盘。文本缓冲器4保持输入标音字符串和变换后的汉字串等。显示部3具有CRT等,显示文本缓冲器4的内容等。辞典选择、顺序指定部8根据编制文件的内容并按照其检索顺序从基本辞典70及多个专业辞典71-7n中选择想检索的多个辞典组,进行登记在辞典群保持部91、92上的处理。辞典检索部6检索保持在辞典群保持部91、92中的辞典,以便将输入的假名字符串变换成假名汉字混和字符串。假名汉字变换控制部5根据辞典检索部6检索到的辞典将输入的假名字符串变换成假名汉字混和字符串。控制部2控制输入部1、文本缓冲器4、显示部3、辞典选择、顺序指定部8、假名汉字变换控制部5等。以下对上述构成的具有专业辞典转换功能的汉字变换装置,说明其工作。使用者根据编制文件内容,用辞典选择、顺序指定部8从基本辞典70及多个专业辞典70-7n中选择将成为检索对象的、汉字与单词登记可能性高的多个辞典,并再指定其检索顺序,将其结果登记于辞典群保持部91、92。例如,编制有关信息处理文件时,把通常变换时想检索的辞典(基本辞典及例如对应文件内容的信息处理用语辞典)、欲变换为固有名词等时把想检索的辞典(例如,姓名辞典、地名辞典、基本辞典)分别以其优先顺序预先登记在辞典群保持部91、辞典群保持部92中。由输入部1输入的假名字符串保持在文本缓冲器4内并由显示部3显示。假名汉字处理中,假名汉字变换控制部5一边用辞典检索部6检索登记于辞典群保持部91、92中的辞典,一边将假名字符串变换成假名汉字混和的字符串。进而用变换后的字符串置换文本缓冲器4内的假名字符串,显示在显示部3上。此时,在预先将上述辞典登记在辞典群保持部91、92中的情况下,通常的假名汉字变换时,因按登记顺序检索登记在辞典群保持部91中的辞典,信息处理用语比一般用语先输出。若文件中出现人名等固有名词,则操作输入部1的辞典群转换键,使被检索的辞典群转换至登记在辞典群保持部92中的辞典。若再次操作辞典的转换键,则回到辞典群保持部91。就这样通过操作辞典群转换键来进行辞典群的转换。另外,因有些内容与本专利技术宗旨无直接关系,省去有关图示与说明。例如同一发音下有多个汉字串、词语的情况下用于将它们按优先顺序或一次全显示于屏幕后让使用者特别指定想要的字语的程序及其所必要的结构;用于将使用者特别指定的汉字串显示于眼下正写作中的文章的所定位置的程序及结构;用于将由许多输入标音字符组成的标音字符串划分成作为整体的汉字变换对象的必要程序,例如最长一致法及实现其的结构,与通常的中文文字处理器、日文文字处理器相同或基本相同。然而,上述以往技术装置存在以下问题。第一个问题由工作人员按输入文件内容选择辞典,且必需转换分专业的辞典。而正确转换专业辞典,对于使用者来说成为大负担。还有,登记在辞典群保持部内的辞典因专业领域不正确时,由最长一致法等截出的作为汉字变换对象的词态素读音码(标音字符串)以及文字变换就不正确,汉字变换效率变差。第二问题若输入文件中包括多个专业的单词,为此而必需对专业选定作繁琐变更时,对使用者来说,转换专业辞典很费时间。本专利技术的目的在于解决上述问题,提供一种能自动又确切选定专业辞典的汉字变换装置。为实现上述目的,本专利技术第一形态的汉字变换装置,是具有将与输入标音字符串对应的词态素读音码截出后送至辞典检索部的输入部、由基本辞典与多本专业辞典构成的辞典部和显示部,其特征是还具有①对各辞典记录其使用次数的辞典记录部;②让上述辞典使用记录部所记录的使用次数多的优先来决定各辞典检索顺序的辞典选择部;③以上述输入部送来的读音记号为检索关键码,按上述辞典选择部决定的检索顺序进行各辞典的检索,取出与读音记号对应的所有同音字、候选词以及登记有它们的专业辞典对应每个同音字、候选词的编码,再送至字符变换部的辞典检索部;④使上述辞典检索部检出的同音字、候选词显示于显示部,让使用者确认正确的变换,同时将登记有被认为正确的同音字、词的辞典的编码送至辞典管理部的字符变换部;⑤根据上述字符变换部送来的辞典编码,按所定程序更新上述辞典使用记录部记录的各辞典的使用次数辞典管理部。本专利技术第二形态的汉字变换装置,是在第一形态基础上再加上这样的特征,即上述辞典管理部更新上述辞典使用记录部的记录时,在记录有使用次数的多本辞典中,规定数量辞典的使用次数达到预定阈值情况下,对迄今的或者汇总汉字变换结束前的使用次数未达到其阈本文档来自技高网...

【技术保护点】
一种汉字变换装置具有将与输入标音字符串对应的词态素读音码截出后送至辞典检索部的输入部、由基本辞典与多本专业辞典构成的辞典部和显示部,其特征是还具有:①对各辞典记录其使用次数的辞典记录部;②让上述辞典使用记录部所记录的使用次数多的优先来决定各辞典检索顺序的辞典选择部;③以上述输入部送来的读音记号为检索关键码,按上述辞典选择部决定的检索顺序进行各辞典的检索,取出与读音记号对应的所有同音字、候选词以及登记有它们的专业辞典对应每个同音字、候选词的编码,再送至字符变换部的辞典检索部;④使上述辞典检索部检出的同音字、候选词显示于显示部,让使用者确认正确的变换,同时将登记有被认为正确的同音字、词的辞典的编码送至辞典管理部的字符变换部;⑤根据上述字符变换部送来的辞典编码,按所定程序更新上述辞典使用记录部记录的各辞典的使用次数的辞典管理部。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:郭俊桔
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1