智能藏文自动分词系统技术方案

技术编号:15251071 阅读:121 留言:0更新日期:2017-05-02 14:18
本发明专利技术提供了智能藏文自动分词系统,包括数据处理服务器、信息录入装置及网络通讯装置,其中信息录入装置若干并通过网络通讯装置与数据处理服务器连接,且各信息录入装置均相互并联,数据处理服务器包括数据采集子服务器、身份认证识别管理子服务器、通讯协议子服务器、数据检索子服务器、字库子服务器、数据处理运算子服务器。本发明专利技术一方面可有效的对藏文进行全面持续录入整理,处理且在藏文的处理过程中,可准确根据藏文词义进行分词操作,提高藏文处理及文本自动分析的工作效率和真确度。

Intelligent Tibetan word segmentation system

The present invention provides intelligent Tibetan word segmentation system, including data processing server, information input device and network communication device, wherein the information input device number and connected by network communication device and data processing server, and the information input device are parallel to each other, the data processing server includes data collection server, authentication server, identification management communication protocol sub server, data retrieval server, server, data processing sub font server operator. One aspect of the invention can effectively carry out comprehensive and sustained input of Tibetan processing and finishing, in the process of Tibetan, accurate segmentation operation according to the Tibetan word processing and automatic text analysis to improve Tibetan work efficiency and accuracy.

【技术实现步骤摘要】

本专利技术涉及一种语言分析处理系统,确切是一种藏文词语自动切分系统。
技术介绍
结合当前藏区经济文化发展需要及藏区文化与其他文化的交流的需要,首先需要构建一个统一高效的集藏文收集、处理及词性解释的网络平台,一方面提高对藏文的统计整理工作,另一方面也有助于非藏区用户对藏文学习及使用的需要,从而达到提高藏区文化交流的需要,处理处理造成对藏文分词准确性相对较差,从而进一步加剧了当前第藏文处理工作中存在错误,严重影响了藏区与其他地区文化交流发展的需要,除此之外,当前的系统也往往仅能满足将藏文处理为英语及简体汉字等少数几种语言种类的的需要,使用灵活性受到的极大的影响,且当前藏文处理系统的结构相对复杂,数据处理能力极其有限,不能有效满足实际使用的需要,因此针对这一现状,需要开发一种全新藏文处理及分词操作系统,以满足实际使用的需要。
技术实现思路
本专利技术的目的是提供本专利技术提供智能藏文自动分词系统。为了达到上述目的,本专利技术提供如下技术方案:智能藏文自动分词系统,包括数据处理服务器、信息录入装置及网络通讯装置,其中信息录入装置若干并通过网络通讯装置与数据处理服务器连接,且各信息录入装置均相互并联,数据处理服务器包括数据采集子服务器、身份认证识别管理子服务器、通讯协议子服务器、数据检索子服务器、字库子服务器、数据处理运算子服务器,字库子服务器分别与数据检索子服务器和数据处理运算子服务器连接,数据处理运算子服务器另分别与数据采集子服务器、身份认证识别管理子服务器、通讯协议子服务器、数据检索子服务器相互连接,其中数据采集子服务器与信息录入装置连接,且每个数据采集子服务器均与至少一个信息录入装置连接,数据检索子服务器与数据处理运算子服务器之间通过数据缓存中继服务器连接。进一步的,所述的网络通讯装置包括至少一路无线通讯网络及至少一路在线通讯网络,且无线通讯网络与在线通讯网络相互并联。进一步的,所述的数据检索子服务器包括至少一个域内检索子系统和至少一个跨域检索子系统,且域内检索子系统和跨域检索子系统之间相互并联。进一步的,所述的域内检索子系统和跨域检索子系统均为两个或两个以上时,则各域内检索子系统之间和各跨域检索子系统之间均相互并联。进一步的,所述的字库子服务器包括藏文字库系统、英语字库系统、基体汉字字库系统、繁体汉字字库系统、扩展字库系统及字库筛选控制系统,其中所述的藏文字库系统、英语字库系统、基体汉字字库系统、繁体汉字字库系统、扩展字库系统均至少一个并分别与字库筛选控制系统连接。进一步的,所述的字库筛选控制系统为基于云数据计算处理平台的数据处理系统。本专利技术系统构成结构简单,结构模块化设计特征显著,数据处理能力强,同时另具有良好的扩展性和通讯能力,从而一方面可有效的对藏文进行全面持续录入整理,另一方面可根据使用需要,对藏文信息的词性进行处理、标注,并将藏文的词性通过多种语言进行输出,且在藏文的处理过程中,可准确根据藏文词义进行分词操作,提高藏文处理及整理工作的工作效率和真确度,从而有效的提高了藏文词性标注作业的工作效率和灵活性,同时也有助于满足不同人群对藏文学习及使用的需要。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术系统结构示意图;图2为数据处理服务器系统结构示意图;图3为字库子服务器系统结构示意图。具体实施方式下面将结合本专利技术的附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,智能藏文自动分词系统,包括数据处理服务器1、信息录入装置2及网络通讯装置3,其中信息录入装置2若干并通过网络通讯装置3与数据处理服务器1连接,且各信息录入装置2均相互并联。如图2所示,本实施例中所述的数据处理服务器1包括数据采集子服务器、身份认证识别管理子服务器、通讯协议子服务器、数据检索子服务器、字库子服务器、数据处理运算子服务器,字库子服务器分别与数据检索子服务器和数据处理运算子服务器连接,数据处理运算子服务器另分别与数据采集子服务器、身份认证识别管理子服务器、通讯协议子服务器、数据检索子服务器相互连接,其中数据采集子服务器与信息录入装置连接,且每个数据采集子服务器均与至少一个信息录入装置连接,数据检索子服务器与数据处理运算子服务器之间通过数据缓存中继服务器连接。本实施例中,所述的网络通讯装置包括至少一路无线通讯网络及至少一路在线通讯网络,且无线通讯网络与在线通讯网络相互并联。本实施例中,所述的数据检索子服务器包括至少一个域内检索子系统和至少一个跨域检索子系统,且域内检索子系统和跨域检索子系统之间相互并联。本实施例中,所述的域内检索子系统和跨域检索子系统均为两个或两个以上时,则各域内检索子系统之间和各跨域检索子系统之间均相互并联。如图3所示,本实施例中所述的字库子服务器包括藏文字库系统、英语字库系统、基体汉字字库系统、繁体汉字字库系统、扩展字库系统及字库筛选控制系统,其中所述的藏文字库系统、英语字库系统、基体汉字字库系统、繁体汉字字库系统、扩展字库系统均至少一个并分别与字库筛选控制系统连接。本实施例中,所述的字库筛选控制系统为基于云数据计算处理平台的数据处理系统。本专利技术系统构成结构简单,结构模块化设计特征显著,数据处理能力强,同时另具有良好的扩展性和通讯能力,从而一方面可有效的对藏文进行全面持续录入整理,另一方面可根据使用需要,对藏文信息的词性进行处理、标注,并将藏文的词性通过多种语言进行输出,且在藏文的处理过程中,可准确根据藏文词义进行分词操作,提高藏文处理及整理工作的工作效率和真确度,从而有效的提高了藏文词性标注作业的工作效率和灵活性,同时也有助于满足不同人群对藏文学习及使用的需要。以上所述,仅为本专利技术的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本专利技术的保护范围之内。因此,本专利技术的保护范围应所述以权利要求的保护范围为准。本文档来自技高网
...

【技术保护点】
智能藏文自动分词系统,其特征在于:所述的智能在线藏文分词系统包括对藏文字符串进行自动分析,确认句子并对句子中的词汇进行自动切分。在这一过程中,所述的数据处理服务器、信息录入装置及网络通讯装置,其中所述的信息录入装置若干并通过网络通讯装置与数据处理服务器连接,且各信息录入装置均相互并联,所述的数据处理服务器包括数据采集子服务器、通讯协议子服务器、数据检索子服务器、字库子服务器、数据处理运算子服务器,所述的字库子服务器分别与数据检索子服务器和数据处理运算子服务器连接,所述的数据处理运算子服务器另分别与数据采集子服务器、通讯协议子服务器、数据检索子服务器相互连接,其中所述的数据采集子服务器与信息录入装置连接,且每个数据采集子服务器均与至少一个信息录入装置连接,数据检索子服务器与数据处理运算子服务器之间通过数据缓存中继服务器连接。

【技术特征摘要】
1.智能藏文自动分词系统,其特征在于:所述的智能在线藏文分词系统包括对藏文字符串进行自动分析,确认句子并对句子中的词汇进行自动切分。在这一过程中,所述的数据处理服务器、信息录入装置及网络通讯装置,其中所述的信息录入装置若干并通过网络通讯装置与数据处理服务器连接,且各信息录入装置均相互并联,所述的数据处理服务器包括数据采集子服务器、通讯协议子服务器、数据检索子服务器、字库子服务器、数据处理运算子服务器,所述的字库子服务器分别与数据检索子服务器和数据处理运算子服务器连接,所述的数据处理运算子服务器另分别与数据采集子服务器、通讯协议子服务器、数据检索子服务器相互连接,其中所述的数据采集子服务器与信息录入装置连接,且每个数据采集子服务器均与至少一个信息录入装置连接,数据检索子服务器与数据处理运算子服务器之间通过数据缓存中继服务器连接。2.根据权利要求1所述的智能藏文自动分词系统,其特征在于:所述的网络通讯装置包括至少一路无线通讯网...

【专利技术属性】
技术研发人员:多拉
申请(专利权)人:海南州云藏藏文信息技术有限公司多拉
类型:发明
国别省市:青海;63

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1