本发明专利技术涉及一种智能系统中的输入法构词模式,谓之“分段构词法”。是使用者在智能系统中通过输入装置、屏幕显示装置、搜索引擎和各存储装置从语言库中进行选择目标、构词的方法;存储装置还进一步包括分段存储装置;具体步骤是:A进入构词状态步骤,B构词操作步骤,C结束构词状态操作步骤。它主要解决freezing pinyin构词法所存在的技术问题,提供了一种全新多样且简便的构词准入方法和分段构词方法,充分利用了功能操作的空置状态达到了与已有专用构词法键位情况下的同样结果,构词操作代价最小,而且构词状态中可以分段构建所需的词语,便于修改、删除。它还可以充分实现在多语种之间共同构成词汇。
【技术实现步骤摘要】
本专利技术涉及在手机、电脑和其他需要文本输入的智能系统中输入文本的方法,特 别是一种智能系统中的输入法构词模式,谓之“分段构词法”。
技术介绍
UffD(Used Word Dictionary)是为使用者提高输入效率和舒适度的一种手段。其 初衷认为已经被选取的词汇有可能近期还会被选取。基本设计原理为将用户输入过程中所 选取的不在首选位置的选项信息置入指定队列首部以便其后再搜索该选项时尽可能使其 出现在首选位置。随着输入进行,不断有新的选项被置入而使空间不够用时,最早置入的 选项被剔出并由此不断地循环往复。搜索引擎在UWD上寻找满足用户输入条件的选项过 程中按设计理念总是后置入的选项在前,先置入的选项在后。例如在用户输入zhongguore 时,来自数据库(即语言库)的选项为“中国人”,“中国热”,…;在用户选择“中国热”以 后,搜索引擎将来自数据库的不在首选位置的“中国热”插入UWD首部。在用户其后再输入 zhongguore时,选项序列为“中国热”,“中国人”,…;所不同的是这里“中国热”来自UWD, “中国人”等其他选项来自于数据库;并且数据库中的“中国热”因为已有来自UWD的相同选 项而没有被入选。PUD (Personal Used Dictionary)顾名思义为使用者自创和拥有的个人词典。其 队列中的所有词汇都是用户自己输入和设定的。最新输入和设定的个人词汇被置入该队列 首部;当出现空间不够用时,最早置入的选项被剔出。由于PUD中的词汇远不如UWD中的词 汇出入频繁,故PUD中词汇的生命周期比UWD的词汇要长很多并且随着时间的推移和输入 的不断积累形成了使用者固有和特有的词汇。PUD和UWD存储装置的基本数据结构是队列。它们与输入键位序列存储装置,选项 序列存储装置和目标选项存储装置一样,也作为系统的配置资源与搜索引擎相连。PUD和 UffD与系统中的数据库相互独立。搜索引擎根据用户输入的字母或数字键位序列总是按UWD、PUD和当前被连接的 语言数据库的顺序寻找选项并放入选项序列存储装置,以此来调节选项的分布。如果数量 众多的选项不可能一次性放入选项序列存储装置,系统将它们分成具有固定选项个数的 段,谓之页,而该固定个数谓之页长。因此选项序列是按页存放在选项序列存储装置并反 映在屏幕显示装置中;于是系统就为使用者设立了转前后页功能使不同页的选项得以显 示;也设立了转前后项功能供使用者选择选项。作为依据输入信息的搜寻结果,选项序列存 储装置内的选项只能被选取而不能被增删或修改。按习惯,使用者只能对输入键位序列存 储装置内自己输入的字符或数字串序列尾部进行增删或修改,然后通过引擎寻找不同的结 果。也正是因为增删操作只在其尾部进行,整个系统和搜索引擎对输入键位序列存储装置 内字符或数字串的尾部不设指针或光标,也没有必要设之。需要提醒的是在不同载体中并 不是所有符号的输入都需要输入键位序列存储装置和选项序列存储装置支持,例如在全键 盘情况数字和常用标点符号由于只有一个选项其输入就不需要经过上述装置而直接进入目标选项存储装置待使用者索取。另外需要强调输入法在输入键位序列存储装置内容空或 非空的情况下其键位功能分布存在很大不同;这是因为处在编辑状态下的受用软件在输入 键位序列存储装置内容为空时并没有交出包括光标上下左右移动,转页,删除,回车等在内 的许多功能操作;而只有在输入键位序列存储装置内容非空的情况下系统进入了输入法结 合语言库搜索的使用状态,此时上述诸功能操作为输入法所用直到本次字,词或句子输入 完成。一般地,PUD和UWD在使用者构词时都需要键位支持得以进入相应的状态。而一 种叫做freezing pinyin的构词法以一种特殊的方式省略了其进入构词状态的键位支持。 该方法目前仍然被包括搜狗输入法在内的一些输入法所使用。其原理是一次性将要构造的 句子或词汇的拼音表达式全部输入,然后返回拼音表达式首部或需要最先改进的部位根据 拼音分布逐个找出所要选项以形成所要构造的词汇或句子。本质上是利用了指向首个选项 的指针再指向前一个选项(这是不可能的空置状态)的停步状态通过返回在输入表达式尾 部指针的操作变成了词汇构造的准入状态。这里所说的键位支持并非仅指该功能自始至终 一直占有某键位;而是指某一时段或某一时刻占有该键位,因为一个键位可以是多功能的, 其操作根据键位图中键位之间任务上的逻辑关系也可以是多元的,更何况还包括长按键或 短按键等。freezing pinyin构词法虽然省略了键位支持并且看起来直观有效,却也带来了 一些难以解决的问题,具体问题表现在。(1)输入拼音表达式后返回是以增加系统操作复杂性为代价,输入键位序列存储 装置内容需要设立指针或光标并且也带来了其前后移动的功能操作或相应的键位支持。 freezing pinyin构词法通过一次性输入所构词汇所需的所有字符或数字串序列然后再返 回的方式,当然可以省去一个构词法的专用键位并且也能规避与其他受用软件在功能上发 生冲突的可能。但由此提高了使用复杂度,代价过高,在构词过程中不易增删修改,同时也 限制了使用范围。正因如此,freezing pinyin构词法不能有效满足在单一或多语种平台 上用各种输入方式操作。另外,在输入键位序列存储装置内设立光标并左右移动不但使系 统变得复杂提高代价,不利于在低端平台操作,也不必要;因为一些输入方式诸如数字和某 些符号输入时并不经过输入键位序列存储装置而无法预置,即便输入键位序列存储装置内 容非空连击输入方式下也难以预置,更何况使用者输入过程中不可预知的功能操作和增删 操作等等。(2)输入拼音表达式后的返回不仅增加了使用的复杂性而且是以用户的操作为代 价,词或句子越长,非拼音表达部分越多代价越高。比如使用者要通过freezing pinyin 构词法构建“国家知识产权局专利局”这个词汇,就需要通过输入装置(键盘)在输入键位 序列存储装置中输入完整的拼音表达式“guojiazhishichanquanjuzhuanliju”,然后再将 输入键位序列存储装置内设立的光标或指针回退到拼音表达式首部以进行构建该词语的 第一个字/词的选取,然后依次选取直至构词完毕。其操作十分复杂,指针和光标选择的 操作代价也十分大。可以想见,若使用者在显示屏幕比较狭小的手机系统上利用freezing pinyin构词法来构建一个比较长的词语,这时,拼音表达式的长度甚至可能超过屏幕覆盖, 其操作将是何其困难,更不用说,屏幕还需要在构词过程中显示选项序列存储装置中对应 的内容。(3) freezing pinyin构词法以所有选项来自拼音为基本理念限制了其使用 范围。随着社会的发展,用户的构词种类千变万化,尤其是跨语种的构词,诸如T恤、上 海-Calgary,甚至一个与拼音没有任何关系的网址www. beidu. com或emai 1地址cfr@ yahoo, com也都可能成为用户的专用词汇,更不用说在多语种平台上用不但来自英语而且 来自诸如法语,德语,或印度语等各种不同语种的词汇和以不同输入方式进行造词造句。甚 至还有一些年轻的网络达人会通过一些符号组合(如@。@),来构建自己需要的词语。而 freezing p本文档来自技高网...
【技术保护点】
一种智能系统中的输入法构词模式,它是使用者(10)在智能系统(1)中通过输入装置(2)、屏幕显示装置(3)、搜索引擎(4)和各存储装置从语言库(6)中进行选择目标、构词的方法;所述的存储装置包括输入键位序列存储装置(51)、选项序列存储装置(52)、目标选项存储装置(53)、PUD存储装置(54)和/或UWD存储装置(55);所述的屏幕显示装置(3)上具有当前输入库和输入方法显示部分(31)、文本显示部分(32)、输入序列显示部分(33)和选项序列显示部分(34);其特征在于:所述的存储装置还进一步包括分段存储装置(56);该方法的具体步骤是:A进入构词状态步骤:通过在输入装置(2)上进行智能系统(1)能识别的进入操作,或者在智能系统(1)判断输入键位序列存储装置(51)为非空状态下通过输入装置(2)进行智能系统(1)能识别的进入操作,以进入构词状态;B构词操作步骤,具体是先执行步骤B3:B1使用者(10)在进入构词状态后通过输入装置(2)输入字符或符号序列,或者字符或符号序列已经在进入构词状态前输入完成,并且字符或符号序列已经进入输入键位序列存储装置(51),搜索引擎(4)在当前语言库(6)中寻找到对应于所述字符或符号序列的选项序列,并提取后存储到选项序列存储装置(52),执行步骤B2;或者在构词状态下通过输入装置(2)输入字符或符号,搜索引擎(4)从当前语言库(6)或从智能系统(1)的资源中获取选项并直接将该选项及对应输入的字符或符号连接到之前移入到分段存储装置(56)的选项尾部,执行步骤B3。B2使用者(10)从当前的选项序列存储装置(52)选择所需的具体选项并通过输入装置(2)操作选定,被选定的选项以及对应于该选项的字符序列分别从选项序列存储装置(52)和输入键位序列存储装置(51)剪切后移入到分段存储装置(56)中并连接到之前移入到分段存储装置(56)的选项尾部,执行步骤B3;若使用者(10)需要删除输入字符或符号序列中最后一个字符或符号,重新输入字符或符号并通过引擎(4)搜索,则通过输入装置(2)执行删除操作,执行步骤B1;B3若使用者(10)需要继续在分段存储装置(56)中追加构词选项,则执行步骤B1;若使用者(10)需要删除构词选项,则通过输入装置(2)执行删除操作,该删除操作从分段存储装置(56)的选项尾部往前执行,删除操作完成后继续执行B1或者执行步骤C;若使用者(10)需要结束构词状态则执...
【技术特征摘要】
【专利技术属性】
技术研发人员:李朝中,
申请(专利权)人:李朝中,
类型:发明
国别省市:CA[]