一种手绘输入法的用户绘制风格快速学习方法、系统、设备及介质,方法为:获取利用大数据集离线训练得到的手绘输入法的识别网络模型参数;从离线训练手绘输入法的识别网络模型训练数据集中,为手绘输入法支持的每个手绘类别随机选取n个手绘图像样本,作为每个手绘类别的绘制示例;为手绘输入法支持的全部或部分手绘类别中的每一类绘制不多于n个手绘图像样本;提取源域和目标域,利用有监督的条件对抗域自适应算法,实现对手绘输入法的基础模型的参数更新;其系统、设备及介质能够使用户对手绘输入法的用户绘制风格进行快速学习;本发明专利技术识别精度高,能够实现手绘输入法用户的新绘制数据的识别精度的快速提升。数据的识别精度的快速提升。数据的识别精度的快速提升。
【技术实现步骤摘要】
一种手绘输入法的用户绘制风格快速学习方法、系统、设备及介质
[0001]本专利技术属于人机交互
,尤其涉及一种手绘输入法的用户绘制风格快速学习方法、系统、设备及介质,可用于对手绘输入法对不同用户绘制风格的快速学习和个性化适配。
技术介绍
[0002]手绘草图线条简洁,绘制方式简单,且能表达丰富的语义信息,作为一种计算机交互语言,手绘草图在很多交互场景中得到广泛的应用。深度学习的发展对计算机视觉研究领域起到了极大的促进作用。在数据量足够的情况下,对深度卷积网络进行训练后,可以做到对数据的高效率识别分类。基于深度卷积网络的手绘输入法识别模型,需要使用大量的手绘数据进行训练,才能做到对手绘数据的准确识别。但是,利用采集的大数据离线训练好了识别模型,当用户的绘制风格和大数据中包含的绘制风格差异较大时,该识别模型的识别精度就急剧降低。这种情况会导致开发好的手绘输入法在被绘制风格迥异的用户使用时效果很差。让每个用户重新采集大数据进行模型的重新训练是不现实的,正确的做法应该是在用户使用过程中利用用户绘制的少部分数据快速优化模型。这就面临小样本情况下用户绘制风格的快速学习问题。
[0003]专利申请CN11510032A公开了一种基于手绘轨迹的形状识别及矫正方法、设备及存储介质,包括:基于预训练的神经网络模型,对获取的手绘轨迹进行大分类识别,以使得手绘轨迹被区分为封闭图形和非封闭图形中的一种;在手绘轨迹为封闭图形时,计算手绘轨迹中存在的拐点,以确定手绘轨迹的具体形状;在手绘轨迹为非封闭图形时,计算手绘轨迹的每三个相邻数据点之间的曲率以获取特征点数量,并根据特征点数量以确定手绘轨迹的具体形状;根据得到的手绘轨迹的具体形状的不同,以及根据拐点或/和特征点,对手绘轨迹进行矫正,以使得手绘轨迹与标准图形拟合。该专利技术可以提高对手绘几何图形识别的准确度,能够较为快速、精确的识别出用户绘制的图形类别并进行矫正。但是,由于不同绘制人员在手绘相同的图标时会呈现出不同的绘制风格,导致基于部分绘制人员采集的数据集训练的网络模型不一定适配绘制风格差异大的其他人。该专利技术只是提出了手绘轨迹形状识别方法,没有解决不同人员绘制风格的快速适配问题。
技术实现思路
[0004]为了解决上述问题,本专利技术提供了一种手绘输入法的用户绘制风格快速学习方法、系统、设备及介质,基于小样本数据,结合域对抗思想,可以实现对用户数据风格的快速学习;测试结果证明,本专利技术只需要使用很少的数据量,即可实现绘制风格迥异用户的新绘制数据的识别精度的快速提升,提高手绘输入法对新用户的适配度。
[0005]为了实现上述目的,本专利技术所采用的技术方案是:
[0006]一种手绘输入法的用户绘制风格快速学习方法,包括以下步骤:
[0007]S1,获取利用大数据集离线训练得到的手绘输入法的识别网络模型参数,包括特征提取器参数和分类器参数,作为手绘输入法的基础模型参数;
[0008]S2,从离线训练手绘输入法的识别网络模型训练数据集中,为手绘输入法支持的每个手绘类别随机选取n个手绘图像样本,作为每个手绘类别的绘制示例样本;手绘图像样本由手绘输入法的开发人员或专门招募的采集人员绘制得到;
[0009]S3,与步骤S2中绘制人员绘制风格不同的用户,即手绘输入法用户分别为手绘输入法支持的全部或部分手绘类别中的每一类绘制不多于n个手绘图像样本;
[0010]S4,把步骤S2中每个手绘类别随机选取的n个绘制示例样本作为源域,把步骤S3中用户绘制的每类不多于n个的样本作为目标域,利用有监督的条件,对抗域自适应算法实现对手绘输入法的基础模型的参数更新。
[0011]进一步的,所述步骤S1中,手绘输入法的识别网络模型是事先基于大数据集离线训练得到的。
[0012]进一步的,所述步骤S3中,手绘输入法用户需要为手绘输入法支持的全部或部分手绘类别的每一类采集不多于n个的样本,作为体现用户个人绘制风格的数据。
[0013]进一步的,所述步骤S4的具体方法为:把S2从大数据中随机选取的样本作为源域数据把用户绘制的样本作为目标域数据其中和为手绘数据,和为类别标签,N
s
和N
t
为样本数;然后利用有监督域对抗算法实现对识别模型的参数更新,算法优化目标为
[0014]和其中
[0015][0016][0017]其中,E
(*)
为期望函数,G为识别模型,D为域判别模型,f
is
和为识别模型输出的特征,和为识别模型的预测结果,表示源域D
s
中的第i个样本,表示目标域D
t
中的第j个样本,L为交叉熵损失。
[0018]一种手绘输入法的用户绘制风格快速学习系统,包括:
[0019]手绘类别识别网络模型,用于对手绘输入法用户绘制的手绘数据进行识别;
[0020]手绘类别推荐模块,用于根据识别网络的识别结果为用户推荐标准的手绘图标,供用户选择其手绘图标对应的正确的标准手绘类别图标,类似中文拼音输入法输入拼音后选择正确的中文文字;
[0021]用户手绘数据存储模块,用于记录用户的手绘样本以及用户从手绘输入法自动推荐的手绘类别中选择的类别标签;
[0022]识别网络模型优化模块,使用步骤S4步骤对手绘输入法识别网络模型进行参数优化。
[0023]一种手绘输入法的用户绘制风格快速学习设备,包括:
[0024]存储器,用于存储计算机程序;
[0025]处理器,用于执行所述计算机程序时实现步骤S1至步骤S4所述一种手绘输入法的
用户绘制风格快速学习方法。
[0026]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时用户能够对手绘输入法的用户绘制风格进行快速学习。
[0027]与现有技术相比,本专利技术具有如下的优点和有益处效果:
[0028](1)本专利技术提出的手绘输入法的用户绘制风格快速学习方法,可以只使用小样本做少量计算,即可实现绘制风格迥异的手绘输入法用户新绘制数据的识别精度的快速提升。
[0029](2)与已有的域自适应方法相比,本专利技术使用有监督的域对抗算法,源域和目标域都只需要少量样本,把每个手绘类别的示例数据作为源域数据,在实际使用过程中也具备可行性;用户在使用过程中不需要为每个手绘类别采集大量数据进行识别网络模型的参数优化,手绘输入法会根据用户正在绘制的数据来预测推荐标准手绘类别,用户从中选择所绘数据对应的正确类别(类似用户使用中文拼音输入法时,输入法会根据用户输入的字母序列来推荐字或词,用户从中选择自己想要的那个字或词),这就提供了有标签的目标域数据。这些因素保证了基于有监督域对抗的域自适应算法的可行性,大大提升域自适应的精度。
附图说明
[0030]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种手绘输入法的用户绘制风格快速学习方法,其特征在于:具体包括以下步骤:S1,获取利用大数据集离线训练得到的手绘输入法的识别网络模型参数,包括特征提取器参数和分类器参数,作为手绘输入法的基础模型参数;S2,从离线训练手绘输入法的识别网络模型训练数据集中,为手绘输入法支持的每个手绘类别随机选取n个手绘图像样本,作为每个手绘类别的绘制示例样本;手绘图像样本由手绘输入法的开发人员或专门招募的采集人员绘制得到;S3,与步骤S2中绘制人员绘制风格不同的用户,即手绘输入法用户分别为手绘输入法支持的全部或部分手绘类别中的每一类绘制不多于n个手绘图像样本;S4,把步骤S2中每个手绘类别随机选取的n个绘制示例样本作为源域,把步骤S3中用户绘制的每类不多于n个的样本作为目标域,利用有监督的条件,对抗域自适应算法实现对手绘输入法的基础模型的参数更新。2.根据权利要求1所述的一种手绘输入法的用户绘制风格快速学习方法,其特征在于:进一步的,所述步骤S1中,手绘输入法的识别网络模型是事先基于大数据集离线训练得到的。3.根据权利要求1所述的一种手绘输入法的用户绘制风格快速学习方法,其特征在于:进一步的,所述步骤S3中,手绘输入法用户需要为手绘输入法支持的全部或部分手绘类别的每一类采集不多于n个的样本,作为体现用户个人绘制风格的数据。4.根据权利要求1所述的一种手绘输入法的用户绘制风格快速学习方法,其特征在于:进一步的,所述步骤S4的具体方法为:把步骤S2从大数据中随机选取的样本作为源域数据把用户绘制的样本作...
【专利技术属性】
技术研发人员:朱光明,张亮,李豪,高尔扬,李宁,
申请(专利权)人:中国船舶集团有限公司综合技术经济研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。