一种页面分析方法及装置制造方法及图纸

技术编号:36732326 阅读:17 留言:0更新日期:2023-03-04 10:00
本发明专利技术实施例提供了一种页面分析方法及装置,涉及数据处理技术领域。该方法包括:获取目标页面中各个控件的属性信息;根据各个控件的属性信息获取各个控件的控件特征;通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;基于所述目标页面的结构特征对所述目标页面进行分析。本发明专利技术实施例用于解决基于页面结构树表示的页面结构难以数据化,无法应用于页面分析的问题。无法应用于页面分析的问题。无法应用于页面分析的问题。

【技术实现步骤摘要】
一种页面分析方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种页面分析方法及装置。

技术介绍

[0002]分析页面的页面结构是一项常见且基础的工作。例如:在进行应用程序(Application)稳定性测试时,常常需要分析App中各个页面的页面结构,并根据分析结果对各个页面内的控件执行不同的操作,进而实现App的自动化遍历以测试应用的稳定性。
[0003]分析页面的页面结构的关键技术为提取页面的结构特征。现有技术中普遍采用基于页面结构树的方式表示页面结构。例如:通过可扩展标记语言(Extensible Markup Language,xml)文件表示页面中的每一个控件的位置坐标、类名、文本等属性信息。在使用页面结构进行页面分析时,页面结构需要为数据化的页面结构,然而,由于不同页面中的控件的数量不同,无法转换为一个维度固定的向量,而且页面结构树中的控件表示顺序还会影响页面结构的最终表示结果,因此基于页面结构树表示的页面结构难以数据化,无法应用于页面分析。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种页面分析方法及装置,用于解决基于页面结构树表示的页面结构难以数据化,无法应用于页面分析的问题。
[0005]为了实现上述目的,本专利技术实施例提供技术方案如下:
[0006]第一方面,本专利技术的实施例提供了一种页面分析方法,包括:
[0007]获取目标页面中各个控件的属性信息;
[0008]根据各个控件的属性信息获取各个控件的控件特征;r/>[0009]通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;
[0010]基于所述目标页面的结构特征对所述目标页面进行分析。
[0011]作为本专利技术实施例一种可选的实施方式,所述基于所述目标页面的结构特征对所述目标页面进行分析,包括:
[0012]根据所述目标页面的结构特征获取所述目标页面的类别。
[0013]作为本专利技术实施例一种可选的实施方式,所述基于所述目标页面的结构特征对所述目标页面进行分析,包括:
[0014]根据所述目标页面的结构特征和第一页面的结构特征,获取所述目标页面与所述第一页面的相似度。
[0015]作为本专利技术实施例一种可选的实施方式,所述根据各个控件的属性信息获取各个控件的控件特征,包括:
[0016]分别在以各个控件的属性信息为第一函数的自变量时,获取所述第一函数的因变量作为各个控件的控件特征;
[0017]其中,所述第一函数为非线性函数。
[0018]作为本专利技术实施例一种可选的实施方式,所述根据各个控件的属性信息获取各个控件的控件特征,包括:
[0019]分别根据各个控件的属性信息和特征提取模型获取各个控件的控件特征;
[0020]其中,所述特征提取模型为基于第一样本数据对第一神经网络模型进行训练获取的模型,所述第一样本数据包括:多个控件的属性信息和所述多个控件的控件特征。
[0021]作为本专利技术实施例一种可选的实施方式,所述根据所述目标页面的结构特征对所述目标页面进行分析,包括:
[0022]分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;
[0023]根据各个控件的比重和Sigmoid函数获取各个控件的执行概率。
[0024]作为本专利技术实施例一种可选的实施方式,所述根据所述目标页面的结构特征对所述目标页面进行分析,包括:
[0025]分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;
[0026]根据各个控件的比重和Softmax函数获取各个控件的执行动作的类型。
[0027]作为本专利技术实施例一种可选的实施方式,所述分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重,包括:
[0028]分别在以各个控件的控件特征和所述目标页面的结构特征为第二函数的自变量时,获取所述第二函数的因变量作为各个控件的比重;
[0029]其中,所述第二函数为非线性函数。
[0030]作为本专利技术实施例一种可选的实施方式,所述分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重,包括:
[0031]分别根据各个控件的控件特征、所述目标页面的结构特征以及比重提取模型获取各个控件的比重;
[0032]其中,所述比重提取模型为基于第二样本数据对第二神经网络模型进行训练获取的模型,所述第二样本数据包括:多个页面中各个控件的控件特征、所述多个页面的结构特征以及所述多个页面中各个控件的比重。
[0033]第二方面,本专利技术实施例提供一种页面分析装置,包括:
[0034]获取单元,用于获取目标页面中各个控件的属性信息;
[0035]第一特征提取单元,用于根据各个控件的属性信息获取各个控件的控件特征;
[0036]第二特征提取单元,用于通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;
[0037]分析单元,用于基于所述目标页面的结构特征对所述目标页面进行分析。
[0038]作为本专利技术实施例一种可选的实施方式,所述分析单元具体用于根据所述目标页
面的结构特征获取所述目标页面的类别。
[0039]作为本专利技术实施例一种可选的实施方式,所述分析单元具体用于根据所述目标页面的结构特征和第一页面的结构特征,获取所述目标页面与所述第一页面的相似度。
[0040]作为本专利技术实施例一种可选的实施方式,所述第一特征提取单元具体用于分别在以各个控件的属性信息为第一函数的自变量时,获取所述第一函数的因变量作为各个控件的控件特征;
[0041]其中,所述第一函数为非线性函数。
[0042]作为本专利技术实施例一种可选的实施方式,所述第一特征提取单元具体用于分别根据各个控件的属性信息和特征提取模型获取各个控件的控件特征;
[0043]其中,所述特征提取模型为基于第一样本数据对第一神经网络模型进行训练获取的模型,所述第一样本数据包括:多个控件的属性信息和所述多个控件的控件特征。
[0044]作为本专利技术实施例一种可选的实施方式,所述分析单元具体用于分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;根据各个控件的比重和Sigmoid函数获取各个控件的执行概率。
[0045]作为本专利技术实施例一种可选的实施方式,所述分析单元具体用于分别根据各个控件的控件特征和所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种页面分析方法,其特征在于,包括:获取目标页面中各个控件的属性信息;根据各个控件的属性信息获取各个控件的控件特征;通过全局特征提取函数,对所述各个控件的控件特征进行融合,得到所述目标页面的结构特征;其中,所述全局特征提取函数支持对任意数量的控件进行控件特征融合,且,在所述全局特征提取函数中所述任意数量控件的控件特征采用不同的输入位置的情况下,所述全局特征提取函数输出的页面结构特征均相同;基于所述目标页面的结构特征对所述目标页面进行分析。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标页面的结构特征对所述目标页面进行分析,包括:根据所述目标页面的结构特征获取所述目标页面的类别。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标页面的结构特征对所述目标页面进行分析,包括:根据所述目标页面的结构特征和第一页面的结构特征,获取所述目标页面与所述第一页面的相似度。4.根据权利要求1所述的方法,其特征在于,所述根据各个控件的属性信息获取各个控件的控件特征,包括:分别在以各个控件的属性信息为第一函数的自变量时,获取所述第一函数的因变量作为各个控件的控件特征;其中,所述第一函数为非线性函数。5.根据权利要求1所述的方法,其特征在于,所述根据各个控件的属性信息获取各个控件的控件特征,包括:分别根据各个控件的属性信息和特征提取模型获取各个控件的控件特征;其中,所述特征提取模型为基于第一样本数据对第一神经网络模型进行训练获取的模型,所述第一样本数据包括:多个控件的属性信息和所述多个控件的控件特征。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标页面的结构特征对所述目标页面进行分析,包括:分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;根据各个控件的比重和Sigmoid函数获取各个控件的执行概率。7.根据权利要求1所述的方法,其特征在于,所述根据所述目标页面的结构特征对所述目标页面进行分析,包括:分别根据各个控件的控件特征和所述目标页面的结构特征,获取各个控件的比重;根据各个控件的比重和Softmax函数获取各个控件的执行动作的类型。...

【专利技术属性】
技术研发人员:丁光磊杨睿智张钊
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1