Automatic classification method of the present invention discloses a kind of event, the audio file format through voice recognition, converted into text, and then through the Chinese word segmentation, POS tagging, text clustering, feature extraction, keyword extraction and all events classification, the same events in the same event theme, classification after finishing, you can clearly see what do events, to avoid the same thing many people or more time reported, resulting in the same event after again due to forget to deal with the situation, through the automatic classification of events after the reported new events can be automatically merged or create a new event theme, event processing in order to help to avoid the same event repeatedly processing, greatly improving the efficiency.
【技术实现步骤摘要】
一种事件的自动分类方法
本专利技术涉及事件自动分类的
,特别涉及一种事件的自动分类方法。
技术介绍
报案是指机关、团体、企事业单位和公民(包括被害人)将发现的有犯罪事实或者犯罪嫌疑人向司法机关报告的行为。报案可以用书面或者口头形式提出。随着信息技术的发展,电话报案也越来越多,通过通话录音的方式来记录为报案提供了便捷,但是在一定的程度上也不便于事件的分类。事件可分为民事案件、刑事案件等,而民事案件或刑事案件下又包括各种大大小小的事件,事件繁多导致司法机关主管机关在事件的处理上较为棘手,由于一个相同的事件存在多人报案的情况,由于报案时间或者报案的形式(书面或者语音)不同,导致系统上对该事件存在多次备案的情况,出现相同的事件反复录入系统,导致后续对该事件进行多次处理的问题,使办事杂乱无序,降低了司法机关的办事效率。为了解决上述问题,帮助工作井然有序进行,提高司法机关对事件的处理效率,有必要提出一种事件的自动分类方法。
技术实现思路
本专利技术的目的在于克服上述现有技术的不足,提供一种事件的自动分类方法,其旨在解决现有技术中相同的事件存在多次备案的情况,易使司法机关对该事件重复处理,导致办事杂乱无序,降低办事效率的技术问题。为实现上述目的,本专利技术提出了一种事件的自动分类方法,包括以下步骤:A)记录报案人提供的书面事件或者音频事件,将书面事件通过文本格式文件、音频事件通过音频格式文件录入指挥中心的电脑系统中;B)对音频格式文件进行语音识别,转换成对应的文本格式文件;C)对所有的文本格式文件进行中文分词;D)对中文分词结果中的每个词进行词性标注,确定 ...
【技术保护点】
一种事件的自动分类方法,其特征在于:包括以下步骤:A)记录报案人提供的书面事件或者音频事件,将书面事件通过文本格式文件、音频事件通过音频格式文件录入指挥中心的电脑系统中;B)对音频格式文件进行语音识别,转换成对应的文本格式文件;C)对所有的文本格式文件进行中文分词;D)对中文分词结果中的每个词进行词性标注,确定每个词的词性;E)利用词性标注后的分词结果,对每个文本格式文件进行文本特征信息的提取;F)基于所有文本格式文件的文本特征信息,进行聚类;G)基于聚类结果,提取出关键词,并根据关键词对所有文本格式文件进行分类;H)基于分类结果,建立事件主题,对相同的事件归类至同一事件主题下。
【技术特征摘要】
1.一种事件的自动分类方法,其特征在于:包括以下步骤:A)记录报案人提供的书面事件或者音频事件,将书面事件通过文本格式文件、音频事件通过音频格式文件录入指挥中心的电脑系统中;B)对音频格式文件进行语音识别,转换成对应的文本格式文件;C)对所有的文本格式文件进行中文分词;D)对中文分词结果中的每个词进行词性标注,确定每个词的词性;E)利用词性标注后的分词结果,对每个文本格式文件进行文本特征信息的提取;F)基于所有文本格式文件的文本特征信息,进行聚类;G)基于聚类结果,提取出关键词,并根据关键词对所有文本格式文件进行分类;H)基于分类结果,建立事件主题,对相同的事件归类至同一事件主题下。2.如权利要求1所述的一种事件的自动分类方法,其特征在于:所述的步骤A)中书面事件指报案人以书面形式提出的报案事件,音频事件指报案人以口头形式提出的报案事件。3.如权利要求1所述的一种事件的自动分类方法,其特征在于:所述的步骤B)中语音识别采用语音识别...
【专利技术属性】
技术研发人员:沈贝伦,沈俊青,陆韵,张登,
申请(专利权)人:杭州中奥科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。