System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 云存储系统内的自动文件组织技术方案_技高网

云存储系统内的自动文件组织技术方案

技术编号:41961120 阅读:4 留言:0更新日期:2024-07-10 16:44
本文描述了用于实现云存储系统内的更计算高效的文件组织的技术。一种方法包括:接收识别文档和文件夹集的信息;对于文件夹集中的每个文件夹,使用训练后的模型来预测文件夹与文档之间的相似度度量;对于文件夹集中的每个文件夹,基于文件夹的预测相似度度量来确定文件夹的得分;使用文件夹集内的文件夹的得分从文件夹集中选择候选文件夹;以及在用户界面上提供用于以将文档与候选文件夹相关联的可选择选项。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、云存储系统可以允许用户将大量文件存储在网络可访问的位置中。存储在云存储系统上的文件可以包括文字处理文档、演示文稿(幻灯片)文档、电子表格文档和/或其他类型的文档。云存储系统还可以提供例如在文件夹结构内的文件组织。用户可以能够在云存储系统上创建多个文件夹,并将各种文件保存或移动到这些文件夹中。用户可以基于例如用户可以保存或移动到文件夹中的文件内容来命名文件夹。文件夹结构可以使用户更快地定位并访问期望的文件。

2、当在云存储系统中创建和/或存储文件时,如果用户未指定特定文件夹,则可以在根文件夹中(例如,在顶层文件夹或用户可见的任何文件夹之外)创建/存储该文件。随着时间的推移,随着在云存储系统中创建和/或存储更多文件,在根文件夹中定位和访问期望的文件可能变得麻烦且计算效率低下。例如,定位和访问根文件夹中的期望文件可能需要利用客户端装置来浏览和/或搜索根文件夹内的大量文件。这会利用客户端装置的大量资源,例如在浏览和/或搜索期间为客户端装置的显示器供电的电源(例如,电池)资源。此外,这会利用大量服务器端资源来处理搜索查询和/或在浏览期间将内容流式传输到客户端装置。此外,可能难以快速识别存储在云存储系统的根文件夹中的相关文件集。因此,在浏览和/或搜索以识别多个相关文件时,客户端装置和/或服务器资源的利用可能增加。此外,手动将文件组织到文件夹中可能是一个耗时的过程,并且可能占用大量客户端装置和/或服务器资源。例如,当用户与图形用户界面交互以手动创建文件夹、手动定位要移动到此类文件夹中的文件以及手动将找到的文件移动(例如,通过拖放)到此类文件夹中时,会利用客户端装置的大量电力资源。


技术实现思路

1、本文所描述的实现方式涉及各种技术以在云存储系统内实现更计算高效的文件组织。在各种实现方式中,给定特定文件,对于可以将特定文件移动到的文件夹提供(例如,以视觉方式呈现)建议。用户可以快速查看此类建议,选择给定的建议(例如,通过单击),并响应于选择将文件自动地添加到文件夹。通过这些方式和其他方式,可以将文件快速添加到适当的文件夹,同时在这样做时减少客户端和/或服务器资源的利用。另外,在各种实现方式中,给定特定文件夹,对于可以移动到该特定文件夹中的文件提供(以视觉方式呈现)建议。用户可以快速查看此类建议,选择给定的建议(例如,通过单击),并响应于选择将文件自动地添加到文件夹。通过这些方式和其他方式,可以用适当的文件快速填充文件夹,同时在这样做时减少客户端和/或服务器资源的利用。对于可以将特定文件移动到的文件夹以及对于可以移动到特定文件夹中的文件的这些建议可以基于文件与文件夹之间的预测相似度。

2、在一些实现方式中,将文件“添加”或“移动”到文件夹中可以通过修改文件的元数据来实现(例如,添加特定标志,或添加/修改指示文件的“位置”或文件的“标签”的一系列位)。在其他实现方式中,将文件“添加”或“移动”到文件夹中可以通过修改指示与文件相关联的文件夹、位置、标签等的索引、表、目录、数据库、数据结构等来实现。这些实现方式可以通过允许快速访问文件夹中的相关文件,同时避免利用客户端和/或服务器资源将文件物理地移动到不同的存储位置,来减少客户端和/或服务器资源的利用。

3、另外地或可替代地,在一些实现方式中,将文件“添加”或“移动”到文件夹中可以包括将文件物理地移动到不同的存储位置,例如,移动到与文件夹中的其他文件位于同一服务器或地理位置接近的服务器上的存储位置。这些实现方式可以通过最大限度地减少对不同地理位置的不同服务器的访问来减少访问特定文件夹内的文件时的延迟。

4、在一些实现方式中,可以使用基于文件与文件夹之间的预测相似度度量的得分来确定对于可以将特定文件移动到的文件夹以及对于可以移动到特定文件夹中的文件的建议。在一些实现方式中,该得分可以进一步基于文件夹权重。例如,与最近还没有被访问的文件夹相比,用户最近已经访问的文件夹可能具有更大的权重。在另一个示例中,可以使用文件夹中的文件数来确定文件夹权重(例如,文件少于第一阈值数量的文件的文件夹和/或文件数大于第二阈值文件数的文件夹的权重可能低于其他文件夹)。

5、可以使用一个或多个训练后的模型来确定预测相似度度量,这些模型处理文件夹的一个或多个文件夹特征以及文件的一个或多个文件特征。在一些实现方式中,当用户接受自动地将文件添加到文件夹的建议时,该接受可以用作重新训练训练后的模型的反馈(例如,训练标签)。在一些实现方式中,当用户不接受自动地将文件添加到文件夹的建议时,该不接受可以用作重新训练训练后的模型的反馈(例如,训练标签)。这些实现方式可以通过最大限度地减少用户不太可能选择的选项的呈现并且通过在重新训练模型之后向用户提供更多相关选项来减少客户端和/或服务器资源的利用。

6、在一些实现方式中,可以使用云存储系统中的用户文件夹数据来训练模型。文件夹数据可以包含有关用户文档以及文档存储在哪些文件夹中的信息。可以从这种数据中提取文档-文件夹对来训练文件夹编码器模型。可以使用文档来训练文档编码器模型。在一些实现方式中,可以对训练数据进行过滤,使得仅使用生产力类型文档(例如,文字处理文档、演示文稿(幻灯片)文档、电子表格文档等)。

7、在一些实现方式中,可以使用语义匹配来预测文档d与文件夹f之间的相似度sim(d, f)。在一些实现方式中,sim(d, f)可以用于对给定文档的一组候选文件夹进行排序,并且可以用于对给定文件夹的一组候选文档进行排序。在一些实现方中,孪生网络(siamese network)模型架构可以用于sim(d, f)。在这种孪生网络架构中,左网络(例如,训练后的文档编码器模型)可以将文档编码为向量表示(d),而右网络(例如,训练后的文件夹编码器模型)可以将文件夹编码为相同维度的另一个向量表示(f)。然后,可以计算sim(d, f)作为(d)与(f)之间的余弦相似度。余弦相似度可以如对数一样进行缩放。

8、在一些实现方式中,可以基于一个或多个文件夹的得分或一个或多个文件的得分满足阈值来建议可以将特定文件移动到的一个或多个文件夹和/或可以移动到特定文件夹中的一个或多个文件。在一些实现方式中,响应于文件夹的得分或文件的得分不满足阈值,可以不提供对于可以将特定文件移动到的文件夹以及对于可以移动到特定文件夹中的文件的建议。

9、通过选择性地提供对于可以将特定文件移动到的文件夹以及对于可以移动到特定文件夹中的文件的建议(例如,基于文件夹的一个或多个相似度度量或得分或文件的一个或多个相似度度量或得分满足一个或多个阈值),实现方式可以避免利用计算资源来呈现不太可能与用户相关的选项。具体来说,当用户不太可能选择建议时,实现方式可以防止在用户界面上浪费地呈现该建议。另外,实现方式可以基于具有满足阈值的得分的文件夹或文件的数量提供不同数量的建议,从而进一步避免利用计算资源呈现不太可能与用户相关的选项。

10、在一些实现方式中,第一(例如,较低)阈值可以与第二(例如,较高)阈本文档来自技高网...

【技术保护点】

1.一种由一个或多个处理器实现的方法,所述方法包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求2所述的方法,其中自动地将所述文档与所述候选文件夹相关联包括将所述文档移动到所述候选文件夹中。

4.根据权利要求2所述的方法,其中自动地将所述文档与所述候选文件夹相关联包括基于所述候选文件夹将标签应用于所述文档。

5.根据权利要求2至4中任一项所述的方法,还包括:

6.根据前述权利要求中任一项所述的方法,其中所述文档和所述文件夹集存储在云存储系统上。

7.根据前述权利要求中任一项所述的方法,其中使用所述训练后的模型来处理所述文件夹的所述一个或多个文件夹特征以及所述文档的所述一个或多个文档特征包括:

8.根据权利要求7的方法,其中所述文档的所述向量表示和所述文件夹的所述向量表示具有相同的维度。

9.根据权利要求7或8的方法,其中确定所述文档的所述向量表示与所述文件夹的所述向量表示之间的所述相似度包括确定余弦相似度。

10.根据前述权利要求中任一项所述的方法,其中使用所述文件夹集内的所述文件夹的所述得分从所述文件夹集中选择所述候选文件夹包括:基于所述候选文件夹的所述得分满足阈值来选择所述候选文件夹。

11.根据前述权利要求中任一项所述的方法,还包括:

12.根据权利要求1至10中任一项所述的方法,还包括:

13.根据前述权利要求中任一项所述的方法,其中在所述用户界面上提供用于将所述文档与所述候选文件夹相关联的所述可选择选项包括:

14.根据权利要求1至12中任一项所述的方法,其中在所述用户界面上提供用于将所述文档与所述候选文件夹相关联的所述可选择选项包括:

15.一种由一个或多个处理器实现的方法,所述方法包括:

16.根据权利要求15所述的方法,还包括:

17.根据权利要求16所述的方法,其中自动地将所述候选文档与所述文件夹相关联包括将所述候选文档移动到所述文件夹中。

18.根据权利要求16所述的方法,其中自动地将所述候选文档与所述文件夹相关联包括基于所述文件夹将标签应用于所述候选文档。

19.根据权利要求16至18中任一项所述的方法,还包括:

20.一种计算机程序产品,所述计算机程序产品包括指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器实施如权利要求1至19中任一项所述的方法。

21.一种计算机可读存储介质,所述计算机可读存储介质包括指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器实施如权利要求1至19中任一项所述的方法。

22.一种系统,所述系统包括处理器、计算机可读存储器、一个或多个计算机可读存储介质,以及共同存储在所述一个或多个计算机可读存储介质上的程序指令,所述程序指令能够执行以实施如权利要求1至19中任一项所述方法。

...

【技术特征摘要】
【国外来华专利技术】

1.一种由一个或多个处理器实现的方法,所述方法包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求2所述的方法,其中自动地将所述文档与所述候选文件夹相关联包括将所述文档移动到所述候选文件夹中。

4.根据权利要求2所述的方法,其中自动地将所述文档与所述候选文件夹相关联包括基于所述候选文件夹将标签应用于所述文档。

5.根据权利要求2至4中任一项所述的方法,还包括:

6.根据前述权利要求中任一项所述的方法,其中所述文档和所述文件夹集存储在云存储系统上。

7.根据前述权利要求中任一项所述的方法,其中使用所述训练后的模型来处理所述文件夹的所述一个或多个文件夹特征以及所述文档的所述一个或多个文档特征包括:

8.根据权利要求7的方法,其中所述文档的所述向量表示和所述文件夹的所述向量表示具有相同的维度。

9.根据权利要求7或8的方法,其中确定所述文档的所述向量表示与所述文件夹的所述向量表示之间的所述相似度包括确定余弦相似度。

10.根据前述权利要求中任一项所述的方法,其中使用所述文件夹集内的所述文件夹的所述得分从所述文件夹集中选择所述候选文件夹包括:基于所述候选文件夹的所述得分满足阈值来选择所述候选文件夹。

11.根据前述权利要求中任一项所述的方法,还包括:

12.根据权利要求1至10中任一项所述的方法,还包括:

13....

【专利技术属性】
技术研发人员:孔维泽张明阳迈克尔·本德斯基马克·亚历山大·纳约尔克迈克·克拉格罗索布兰登·瓦尔果雷米·博格
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1