用于对注释和编辑关系进行建模的架构制造技术

技术编号:30887439 阅读:17 留言:0更新日期:2021-11-22 21:00
本文大体上讨论了用于确定编辑与注释之间的关系的设备、系统和方法。一种系统可以包括:存储器,用以存储定义机器学习(ML)模型的参数,ML模型用以确定作者或审阅者对文档的内容的编辑与相同或不同的作者或审阅者的关于文档的内容的注释之间的关系;以及处理电路系统,用以提供注释和编辑作为ML模型的输入,以及从ML模型接收指示注释与编辑之间的关系的数据,关系包括编辑处理注释还是作为注释的目标的内容的位置。标的内容的位置。标的内容的位置。

【技术实现步骤摘要】
【国外来华专利技术】用于对注释和编辑关系进行建模的架构

技术介绍

[0001]考虑到一个或多个作者在文档演变期间所做的大量编辑和注释,协作文档的管理可能很困难。对编辑和注释之间的关系进行可靠建模可以帮助用户追踪不断变化的文档。因此,本文的主题涉及探索注释和编辑之间的关系。

技术实现思路

[0002]该
技术实现思路
章节被提供来以简化形式引入实施例的各个方面,并且在详细描述中进一步解释以下实施例。该
技术实现思路
章节不旨在标识所要求保护的主题的必要或所需特征,并且在该
技术实现思路
章节中列出的元件的组合和顺序不旨在向所要求保护的主题的元件提供限制。
[0003]一种系统可以被配置为实现机器学习(ML)技术。ML技术可以标识相同或不同文档的编辑和注释之间的关系。该系统可以包括存储器,用以存储定义ML模型的参数,以确定作者或审阅者对文档内容的编辑与相同或不同的作者或审阅者的关于文档内容的注释之间的关系。该系统可以包括处理电路系统,以提供注释和编辑作为ML模型的输入,并从ML模型接收指示注释和编辑之间的关系的数据,该关系包括编辑处理注释还是作为注释目标的内容的位置。
[0004]注释与编辑之间的关系可以指示以下至少一项:(a)与编辑最相关的注释,或者(b)给定注释,最有可能成为编辑目标的文档的位置。ML模型可以被配置为确定编辑与注释之间的相关性分数,并且基于相关性分数来指示注释与编辑之间的关系。
[0005]通过将仅在编辑前版本中的内容与第一标签相关联,将仅在编辑后版本中的内容与不同的第二标签相关联,并且将在编辑前版本和编辑后版本中的内容与不同的第三标签相关联,处理电路系统还可以基于文档的编辑前版本和文档的编辑后版本来确定动作编码,动作编码指示内容是否在文档的编辑前版本和编辑后版本的内容之间相同、被移除或被添加。ML模型还可以基于动作编码来确定注释与编辑之间的关系。
[0006]ML模型可以包括使用监督学习技术训练的分层神经网络(NN)。ML模型可以包括:将编辑和注释中的词语投影到一个或多个相应向量空间的输入嵌入层、用以基于所投影的编辑和注释来对内容之间的顺序交互进行建模的上下文嵌入层、用以基于所建模的顺序交互来对编辑和注释之间的关系进行建模的注释编辑注意力层、以及用以基于所建模的关系来确定编辑和注释之间的关系的输出层。上下文嵌入层可以基于编辑和注释来确定相似性矩阵,其中相似性矩阵指示编辑内容与注释内容的相似程度。注释编辑注意力层可以确定与动作编码组合的相似性矩阵的归一化概率分布。处理电路系统还可以向生成了文档的应用提供信号,该信号指示对文档的修改。
[0007]一种确定文档修订与编辑文档的修订注释之间的关系的方法可以包括:利用第一标签标记编辑文档的编辑前版本与编辑文档的编辑后版本之间的未改变内容;利用不同的第二标签标记编辑文档的编辑前版本中的内容,该内容不同于编辑文档的编辑后版本中的内容;利用不同的第三标签标记编辑文档的编辑后版本中的文档修订,该文档修订对应于
编辑文档的编辑后版本中的内容,该内容不同于编辑文档的编辑前版本中的内容;以及基于编辑文档的编辑前版本中的内容,确定编辑文档的编辑后版本中的内容、修订注释以及第一标签、第二标签和第三标签,并且使用机器学习(ML)模型,确定修订注释与文档修订之间的关系。
[0008]该方法还可以包括,其中ML模型基于注释排名损失函数和编辑锚定损失函数中的至少一个而被训练。该方法还可以包括,其中ML模型基于注释排名损失函数和编辑锚定损失函数两者而被训练。该方法还可以包括,其中ML模型是使用监督学习技术训练的分层神经网络(NN)。
[0009]该方法还可以包括,其中ML模型包括将文档修订和修订注释投影到向量空间的输入嵌入层、用以基于所投影的编辑和注释来对内容之间的顺序交互进行建模的上下文嵌入层、用以基于所建模的顺序交互来对投影和嵌入的编辑与投影和嵌入的注释之间的关系进行建模的注释编辑注意力层、以及用以基于所建模的关系来确定文档修订和注释之间的关系的输出层。该方法还可以包括,其中上下文嵌入层基于文档修订和修订注释来确定相似性矩阵,其中相似性矩阵指示文档修订的内容与修订注释的内容的相似程度。
[0010]一种机器可读介质(MRM)可以包括指令,在由机器执行时,该指令将机器配置为执行操作,该操作包括:接收文档的编辑前内容、文档的编辑后内容和与文档相关联的注释;对编辑前内容、编辑后内容和注释操作机器学习(ML)模型,以确定指示编辑后内容中的不在编辑前内容中的内容与注释之间的关系的相关性分数;以及提供指示编辑后内容中的不在编辑前内容中的内容与注释之间的关系的数据。MRM还可以包括,其中操作还包括:利用第一标签标记文档的编辑前版本与文档的编辑后版本之间的未改变内容;利用不同的第二标签标记文档的编辑前版本中的内容,该内容不同于文档的编辑后版本中的内容;利用不同的第三标签标记文档的编辑后版本中的内容,该内容不同于文档的标记前版本中的内容,并且其中操作ML模型包括还对第一标签、第二标签和第三标签操作ML模型,以确定编辑后内容中的不在编辑前内容中的内容与文档的注释之间的关系。
[0011]MRM还可以包括,其中ML模型基于注释排名损失函数和编辑锚定损失函数中的至少一个而被训练。MRM还可以包括,其中ML模型基于注释排名损失函数和编辑锚定损失函数两者而被训练。MRM还可以包括,其中ML模型是使用监督学习技术训练的分层神经网络(NN)。
附图说明
[0012]图1通过示例图示了文档的实施例的图。
[0013]图2通过示例图示了用于标记文档中的改变的方法的实施例的图。
[0014]图3通过示例图示了用于将注释与编辑(或反之亦然)相关联的方法的实施例的图。
[0015]图4通过示例图示了用于确定注释与编辑(或反之亦然)之间的关系的系统的实施例的图。
[0016]图5通过示例图示了用于确定文档内容的注释与编辑之间的关系的系统的实施例的图。
[0017]图6通过示例图示了用于确定注释与编辑之间的关系的方法的实施例的图。
[0018]图7通过示例图示了用以实现一个或多个实施例的机器(例如计算机系统)的实施例的框图。
具体实施方式
[0019]在以下描述中,参照形成其一部分并且通过图示的方式示出可以被实践的具体实施例的附图。这些实施例是用足够的细节描述的,以使本领域技术人员能够实践实施例。要理解的是,其他实施例可以被使用,并且在不脱离实施例的范围的情况下,结构、逻辑和/或电气改变可以被进行。因此,实施例的以下描述不是限制意义的,并且实施例的范围由所附权利要求限定。
[0020]在一些实施例中,本文描述的操作、功能或技术可以在软件中实现。软件可以包括存储在计算机或者其他机器可读介质或存储设备(诸如一个或多个非瞬态存储器(例如非瞬态机器可读介质)或其他类型的基于硬件的存储设备(本地的或联网的))上的计算机可执行指令。进一步地,这种功能可以对应于子系统,该子系统可以是软件、硬件、固件或其组合。多个功能可以在一个或多个子系统中根据需要执行,并且所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:存储器,用以存储定义机器学习(ML)模型的参数,所述ML模型用以确定作者或审阅者对文档的内容的编辑与相同或不同的作者或审阅者的关于所述文档的所述内容的注释之间的关系;以及处理电路系统,用以:提供所述注释和所述编辑作为所述ML模型的输入;以及从所述ML模型接收指示所述注释与所述编辑之间的关系的数据,所述关系包括所述编辑处理所述注释还是作为所述注释的目标的所述内容的位置。2.根据权利要求1所述的系统,其中所述注释与所述编辑之间的所述关系指示以下至少一项:(a)与所述编辑最相关的所述注释,或者(b)给定所述注释,最有可能成为所述编辑的所述目标的所述文档的位置。3.根据权利要求2所述的系统,其中所述ML模型被配置为确定所述编辑与所述注释之间的相关性分数,并且基于所述相关性分数来指示所述注释与所述编辑之间的所述关系。4.根据权利要求1所述的系统,其中所述处理电路系统还用以:基于所述文档的编辑前版本和所述文档的编辑后版本,通过将仅在所述编辑前版本中的内容与第一标签相关联,将仅在所述编辑后版本中的内容与不同的第二标签相关联,并且将在所述编辑前版本和所述编辑后版本中的内容与不同的第三标签相关联,来确定动作编码,所述动作编码指示所述内容是否在所述文档的所述编辑前版本和编辑后版本的内容之间相同、被移除或被添加;以及将具有所述注释和所述编辑的所述动作编码提供给所述ML模型;其中所述ML模型还基于所述动作编码来确定所述注释与所述编辑之间的所述关系。5.根据权利要求4所述的系统,其中所述ML模型是使用监督学习技术训练的分层神经网络(NN)。6.根据权利要求5所述的系统,其中所述ML模型包括:将所述编辑和所述注释中的词语投影到一个或多个相应向量空间的输入嵌入层、用以基于所投影的所述编辑和所述注释来对内容之间的顺序交互进行建模的上下文嵌入层、用以基于所建模的所述顺序交互来对所述编辑和所述注释之间的关系进行建模的注释编辑注意力层、以及用以基于所建模的所述关系来确定所述编辑和所述注释之间的所述...

【专利技术属性】
技术研发人员:张绪超S
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1