基于模型训练的方言识别系统技术方案

技术编号:29136542 阅读:46 留言:0更新日期:2021-07-02 22:32
本发明专利技术涉及一种基于模型训练的方言识别系统,包括:智能识别机构,用于从处理后的所有字符中随机选择与径向神经网络模型的输入层的输入数据个数相等的多个字符作为径向神经网络模型的输入层的输入数据,采用所述径向神经网络模型对所述目标播放影片的所属语言类型和所属方言类型进行识别,以分别获得当前语言类型和当前方言类型;模型训练设备,与所述智能识别机构连接,对所述径向神经网络模型进行训练。本发明专利技术的基于模型训练的方言识别系统结构紧凑、方便使用。由于采用了人工智能模式对每一个播放影片所属语言类型和所属地区方言进行现场辨识,从而避免审片方陷入冗长的审片任务中。

【技术实现步骤摘要】
基于模型训练的方言识别系统
本专利技术涉及人工智能领域,尤其涉及一种基于模型训练的方言识别系统。
技术介绍
人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。关于什么是“智能”,就问题多多了。这涉及到其它诸如意识(CONSCIOUSNESS)、自我(SELF)、思维(MIND)(包括无意识的思维(UNCONSCIOUS_MIND))等等问题。人唯一了解的智能是人本身的智能,这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。人工智能在计算机领域内,得到了愈加广泛的重视。并在机器人,经济政治决策,控制系统,仿真系统中得到应用。目前,在审片方进行审片过程中,由于待审的影片文件非常多,而审片人员有限,如果采用人工模式对每一个待审的影片文件进行播放和肉眼识别各种相关参数,显然会陷入到冗长、繁琐的审片过程中,因此,需要一种智能化解决方案以替换上述人工模式,提升审片的效率和速度。
技术实现思路
为了解决相关领域的技术问题,本专利技术提供了一种基于模型训练的方言识别系统,能够在基于影片内容的自适应模型训练机制的基础上,采用径向神经网络模型对每一个播放影片所属语言类型和所属地区方言进行现场辨识,从而为执行繁琐审片任务的审片方节约大量时间。为此,本专利技术至少需要具备以下两处关键的专利技术点:(1)采用径向神经网络模型对每一个播放影片所属语言类型和所属地区方言进行现场辨识,从而提升审片效率和速度;(2)采用定制模型训练机制对径向神经网络模型训练,所述训练机制基于当前播放影片的字符数据自适应修正,从而提升模型训练的效果。根据本专利技术的一方面,提供了一种基于模型训练的方言识别系统,所述系统包括:帧率检测机构,与当前播放状态下的影片播放机构连接,用于对所述影片播放机构的播放帧率进行检测,以获得现场播放帧率。本专利技术的基于模型训练的方言识别系统结构紧凑、方便使用。由于采用了人工智能模式对每一个播放影片所属语言类型和所属地区方言进行现场辨识,从而避免审片方陷入冗长的审片任务中。具体实施方式下面将对本专利技术的基于模型训练的方言识别系统的实施方案进行详细说明。方言(英文:topolect、dialect)一词最早出自汉扬雄(前53—18)的《輶轩使者绝代语释别国方言》一书。“方言”在不同的人群中指代不同,中国人口中所称“方言(Topolect)”是一个政治学概念,实为“地方语言”,又称“白话(Vernacular)”、“土话”或“土音”,指的是区别于标准语的某一地区的语言,这种叫法不考虑语言间的亲属关系。欧洲人口中的“方言(Dialect)”是一个语言学概念,指的是十八世纪后开始普遍称呼的位于“语言(language)”下一级的“方言”,它根据语言之间的亲属关系(发音、词汇、语法)划分出语系(family)、语族(group)、语支(branch)和语言(language),位于语言下的则是方言(dialect),考虑到中国的特殊情况,“汉语方言”翻译成英文则是“VarietiesofChinese”。根据欧洲人的理解,一种语言中跟标准语有区别的、只通行于一个地区的语言,那就是方言。目前,在审片方进行审片过程中,由于待审的影片文件非常多,而审片人员有限,如果采用人工模式对每一个待审的影片文件进行播放和肉眼识别各种相关参数,显然会陷入到冗长、繁琐的审片过程中,因此,需要一种智能化解决方案以替换上述人工模式,提升审片的效率和速度。为了克服上述不足,本专利技术搭建了一种基于模型训练的方言识别系统,能够有效解决相应的技术问题。根据本专利技术实施方案示出的基于模型训练的方言识别系统包括:帧率检测机构,与当前播放状态下的影片播放机构连接,用于对所述影片播放机构的播放帧率进行检测,以获得现场播放帧率。接着,继续对本专利技术的基于模型训练的方言识别系统的具体结构进行进一步的说明。所述基于模型训练的方言识别系统中还可以包括:影片播放机构,用于获取目标播放影片,并按照所述目标播放影片的设定帧率对所述目标播放影片进行播放。所述基于模型训练的方言识别系统中还可以包括:信息抓取设备,与所述帧率检测机构连接,用于基于接收到的现场播放帧率调节抓取播放画面的持续时长以获得各个抓取画面。所述基于模型训练的方言识别系统中还可以包括:内容提取设备,与所述信息抓取设备连接,用于对每一个抓取画面进行字符识别以获得对应的一个或多个字符,并将各个抓取画面被字符识别到的所有字符组成一个字符集合;预处理机构,与所述内容提取设备连接,用于对接收到的字符集合中的每一个字符进行预处理以使得所述处理后的所有字符占据的比特位相等;智能识别机构,与所述预处理机构连接,用于从所述处理后的所有字符中随机选择与径向神经网络模型的输入层的输入数据个数相等的多个字符作为径向神经网络模型的输入层的输入数据,采用所述径向神经网络模型对所述目标播放影片的所属语言类型和所属方言类型进行识别,以分别获得当前语言类型和当前方言类型;模型训练设备,与所述智能识别机构连接,对所述径向神经网络模型进行训练,所述径向神经网络模型的输出层的输出数据有两个,分别为语言类型和方言类型;其中,对所述径向神经网络模型进行训练包括:采用已知语言类型和已知方言类型的多个字符作为参考字符输入到所述径向神经网络模型进行训练;其中,已知语言类型和已知方言类型的多个字符中,每一个字符占据的比特位等于所述参考比特位数;其中,已知语言类型和已知方言类型的多个字符的数量等于径向神经网络模型的输入层的输入数据个数;其中,所述模型训练设备在所述智能识别机构之前动作以完成所述径向神经网络模型的训练;其中,所述智能识别机构使用的所述径向神经网络模型为所述模型训练设备训练后的径向神经网络模型;其中,对接收到的字符集合中的每一个字符进行预处理以使得所述处理后的所有字符占据的比特位相等包括:将接收到的字符集合中占据比特位最多的字符占据的比特位作为参考比特位数,对接收到的字符集合中的每一个字符进行预处理以使得所述处理后的所有字符占据的比特位数等于所述参考比特位数;其中,对接收到的字符集合中的每一个字符进行预处理以使得所述处理后的所有字符占据的比特位数等于所述参考比特位数包括:当某一个字符占据的比特位数小于所述参考比特位数时,对其进行高位补零以使得其占据的比特位数等于所述参考比特位数。所述基于模型训练的方言识别系统中:基于接收到的现场播放帧率调本文档来自技高网...

【技术保护点】
1.一种基于模型训练的方言识别系统,其特征在于,所述系统包括:/n帧率检测机构,与当前播放状态下的影片播放机构连接,用于对所述影片播放机构的播放帧率进行检测,以获得现场播放帧率。/n

【技术特征摘要】
1.一种基于模型训练的方言识别系统,其特征在于,所述系统包括:
帧率检测机构,与当前播放状态下的影片播放机构连接,用于对所述影片播放机构的播放帧率进行检测,以获得现场播放帧率。


2.如权利要求1所述的基于模型训练的方言识别系统,其特征在于,所述系统还包括:
影片播放机构,用于获取目标播放影片,并按照所述目标播放影片的设定帧率对所述目标播放影片进行播放。


3.如权利要求2所述的基于模型训练的方言识别系统,其特征在于,所述系统还包括:
信息抓取设备,与所述帧率检测机构连接,用于基于接收到的现场播放帧率调节抓取播放画面的持续时长以获得各个抓取画面。


4.如权利要求3所述的基于模型训练的方言识别系统,其特征在于,所述系统还包括:
内容提取设备,与所述信息抓取设备连接,用于对每一个抓取画面进行字符识别以获得对应的一个或多个字符,并将各个抓取画面被字符识别到的所有字符组成一个字符集合;
预处理机构,与所述内容提取设备连接,用于对接收到的字符集合中的每一个字符进行预处理以使得所述处理后的所有字符占据的比特位相等;
智能识别机构,与所述预处理机构连接,用于从所述处理后的所有字符中随机选择与径向神经网络模型的输入层的输入数据个数相等的多个字符作为径向神经网络模型的输入层的输入数据,采用所述径向神经网络模型对所述目标播放影片的所属语言类型和所属方言类型进行识别,以分别获得当前语言类型和当前方言类型;
模型训练设备,与所述智能识别机构连接,对所述径向神经网络模型进行训练,所述径向神经网络模型的输出层的输出数据有两个,分别为语言类型和方言类型;
其中,对所述径向神经网络模型进行训练包括:采用已知语言类型和已知方言类型的多个字符作为参考字符输入到所述径向神经网络模型进行训练;
其中,已知语言类型和已知方言类型的多个字符中,每一个字符占据的比特位等于所述参考比特位数;
其中,已知语言类型和已知方言类型的多个字符的数量...

【专利技术属性】
技术研发人员:杨洋
申请(专利权)人:泰州市朗嘉馨网络科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1