【技术实现步骤摘要】
一种基于文本语义理解的定向文本润色方法
[0001]本专利技术涉及人工智能
、
大数据
、
自然语言处理
、AIGC、
信息抽取领域,尤其涉及一种基于文本语义理解的定向文本润色方法
。
技术介绍
[0002]文本润色指的是对一段文本,在不改变其原意的情况下,调整其表达方式,使其在阅读起来更通顺
、
更高级且更有技巧
。
现有的自动文本润色技术多是采用规则匹配的方式对句子中的字或词汇进行替换
。
例如,可以预设规则:“负责
”→“
主导”,则机器会将一段话中全部的词汇“负责”替换为“主导”。
另一种现有的文本润色技术是直接将目标润色句投入大语言模型中,让语言模型自行理解
,
并进行最终生成
。
[0003]但词槽替换方式的文本优化,存在以下几点缺陷:
1.
词槽配置麻烦,词汇量太多,且各个词汇之间又多是多对多关系,配置需求量成指数级上升
。2.
直接进行词槽替换,存在导致句子混淆度骤升的潜在影响
。3.
灵活性低,只能进行词汇的替换,不能对句型进行替换
。4.
缺乏兼容性,有些时候文本中会包含错别字,这些错别字会导致先前配备的规则失效
。
[0004]而直接使用语言模型的润色方式,其最主要的缺点就是其内容的不可控性
。
语言模型生成的句子,在句子表达上通常符合“更通顺 ...
【技术保护点】
【技术特征摘要】
1.
一种基于文本语义理解的定向文本润色方法,其特征在于,该方法包括以下步骤:
a. 信息抽取:利用
BERT
类编码模型对目标句进行编码处理,输出其中蕴藏的信息数据;
b. 信息调整:上述步骤
a
输出的结果若存在信息缺失的情况,或者存在信息补充
、
信息删减的诉求,进行人工可侵入的信息量...
【专利技术属性】
技术研发人员:陈润天,周泽安,钟成,
申请(专利权)人:珠海必优科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。