【技术实现步骤摘要】
剧本处理方法、装置、电子设备及计算机可读存储介质
本专利技术属于计算机
,特别是涉及一种剧本处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
在规范化管理、拍摄统筹管理、剧本智能评估等应用场景中,往往涉及到对剧本中的待整理信息进行分析。其中,待整理信息指的是集编号、场景编号、时间、地点及人物的场景信息字符。而这些场景信息字符往往分散在剧本内容中,现有技术中往往是预先限定固定的几种固定的场景信息格式模板,并利用固定格式模板直接从剧本中提取待整理信息。由于编剧的书写习惯不同,每个剧本中文本的编写结构存在较大差异,这样,在剧本的格式与固定格式模板中的格式差距较大时,会导致按照固定格式模板提取的待整理信息的准确性较低。
技术实现思路
本专利技术提供一种剧本处理方法、装置、电子设备及计算机可读存储介质,以便解决提取的待整理信息的准确性较低的问题。在本专利技术实施的第一方面,首先提供了一种剧本处理方法,应用于电子设备,该方法包括:根据预设的集编号表述范围,确定所述待处理剧本中包含的集编号以及所述集编号的位置,并根据所述包含的集编号及所述集编号的位置将所述待处理剧本分割为多个剧集;对于至少一个所述剧集,根据预设的场景编号表述范围,确定所述剧集中包含的场景编号以及所述场景编号的位置,并根据所述场景编号及所述场景编号的位置将所述剧集分割为所述多个场景文本;对于至少一个所述场景文本,提取所述场景文本中包含的场景信息字符;将所述场景文本中包含的场景信息字符、 ...
【技术保护点】
1.一种剧本处理方法,其特征在于,应用于电子设备,所述方法包括:/n根据预设的集编号表述范围,确定所述待处理剧本中包含的集编号以及所述集编号的位置,并根据所述集编号及所述集编号的位置将所述待处理剧本分割为多个剧集;/n对于至少一个所述剧集,根据预设的场景编号表述范围,确定所述剧集中包含的场景编号以及所述场景编号的位置,并根据所述场景编号及所述场景编号的位置将所述剧集分割为所述多个场景文本;/n对于至少一个所述场景文本,提取所述场景文本中包含的场景信息字符;/n将所述场景文本中包含的场景信息字符、所述场景文本的场景编号及所述场景文本所属剧集的集编号,确定为所述场景文本的待整理信息;/n将所述场景文本的待整理信息以及所述场景文本中的正文文本,按照预设形式进行组合,形成目标剧本。/n
【技术特征摘要】
1.一种剧本处理方法,其特征在于,应用于电子设备,所述方法包括:
根据预设的集编号表述范围,确定所述待处理剧本中包含的集编号以及所述集编号的位置,并根据所述集编号及所述集编号的位置将所述待处理剧本分割为多个剧集;
对于至少一个所述剧集,根据预设的场景编号表述范围,确定所述剧集中包含的场景编号以及所述场景编号的位置,并根据所述场景编号及所述场景编号的位置将所述剧集分割为所述多个场景文本;
对于至少一个所述场景文本,提取所述场景文本中包含的场景信息字符;
将所述场景文本中包含的场景信息字符、所述场景文本的场景编号及所述场景文本所属剧集的集编号,确定为所述场景文本的待整理信息;
将所述场景文本的待整理信息以及所述场景文本中的正文文本,按照预设形式进行组合,形成目标剧本。
2.根据权利要求1所述的方法,其特征在于,所述对于至少一个所述场景文本,提取所述场景文本中包含的场景信息字符,包括:
根据预设的场景信息提示词范围值,对所述场景文本进行遍历,以确定所述场景文本中是否包含场景信息提示词;
若所述场景文本中包含场景信息提示词,将与所述场景信息提示词相邻的字符确定为场景信息字符,并进行提取;
若所述场景文本中不包含场景信息提示词,将所述场景文本划分为多个子文本;根据预设的场景信息字符范围值和/或所述子文本中词语的词性,从所述子文本中提取场景信息字符。
3.根据权利要求2所述的方法,其特征在于,所述根据预设的场景信息字符范围值和/或所述子文本中词语的词性,从所述子文本中提取场景信息字符,包括:
确定所述子文本中包含的词语的词性;将词性为预设词性且包含特定字的词语,确定为场景信息字符,并进行提取;
和/或,根据预设的场景信息字符范围值对所述子文本进行遍历,以确定所述子文本中是否包含存在于所述预设的场景信息字符范围值的字符;若包含,将所述字符确定为场景信息字符,并进行提取;
其中,所述场景信息字符范围值中至少包含以下信息中的一种:常用的表示时间的字符、表示地点的字符、表示天气的字符及表示人名的字符。
4.根据权利要求1所述的方法,其特征在于,所述根据预设的集编号表述范围,确定所述待处理剧本中包含的集编号以及所述集编号的位置,包括:
根据所述预设的集编号表述范围,生成集编号正则表达式;所述集编号正则表达式中定义有所述集编号表述范围中包含的集编号;
利用所述集编号正则表达式对所述待处理剧本进行正则匹配,确定所述待处理剧本中包含的各个剧集的集编号以及所述集编号的位置。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的场景编号表述范围,确定所述剧集中包含的场景编号以及...
【专利技术属性】
技术研发人员:郏昕,阳任科,赵冲翔,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。