大规模持续集成的测试用例优先级排序方法、设备及介质技术

技术编号：35945182 阅读：25 留言：0更新日期：2022-12-14 10:35

本发明专利技术公开了大规模持续集成的测试用例优先级排序方法、设备及介质，涉及计算机软件测试技术领域，解决了现有的测试用例排序方法不能快速高效并准确对测试用例进行排序的问题，其技术方案要点是：第一排序，所述第一排序操作包含解析目标代码，所述目标代码包含测试代码，对所述目标代码进行词元化处理，得到至少包含测试用例表示；通过检索算法对测试用例进行第一排序，得到初排测试集；以及第二排序，所述第二排序包含筛选排序后的初排测试集用于作为模型的训练集；将经过训练集训练后的模型对所述初排测试集进行第二排序，得到测试用例优先级排序结果，达到快速高效地对测试用例排序，并提高排序准确性的目的。并提高排序准确性的目的。并提高排序准确性的目的。

全部详细技术资料下载

【技术实现步骤摘要】
大规模持续集成的测试用例优先级排序方法、设备及介质

[0001]本专利技术涉及计算机软件测试
，更具体地说，它涉及大规模持续集成的测试用例优先级排序方法、设备及介质。

技术介绍

[0002]持续集成鼓励开发人员频繁地将更改的代码集成到主线代码库，并通过自动化构建和测试来验证提交代码的质量。与传统的开发模式相比，持续集成有利于更早、更快速地检测出代码的错误，从而支持产品的快速迭代。随着持续集成的广泛应用，大量变更代码以极其频繁的速度提交，由于代码更改提交非常频繁，测试数量以惊人的速度增加，如何优化持续集成以降低测试成本和缩短测试反馈周期，以提高测试成本效益，是持续集成在实际应用过程中面临的主要挑战。
[0003]目前，人们提出的持续集成测试优化方法：(1)基于覆盖信息、风险分析等的传统TCP技术在典型的持续集成环境中变得不适用，因为更改程序代码极其频繁地提交，大量的信息分析和收集需要大量的时间成本。(2)基于启发式规则或信息检索技术的轻量级测试用例排序模型，因忽略了代码语义、上下文等信息，导致测试排序的性能仍然有较大提升空间。(3)基于深度学习的测试用例排序技术(例如，强化学习，预训练语言模型BERT)，能取得较好的排序性能，但是复杂的模型训练需要大量的训练时间和复杂的参数设置。
[0004]综上可知，现有的测试用例排序方法中基于覆盖等测试用例排序技术、基于信息检索技术、机器学习或者深度学习方法，难以满足大规模持续集成中对测试的要求。

技术实现思路

[0005]本专利技术的目的是提...

【技术保护点】

【技术特征摘要】
1.一种大规模持续集成的测试用例优先级排序方法，其特征在于，包括：第一排序，所述第一排序操作包含解析目标代码，所述目标代码包含测试代码，对所述目标代码进行词元化处理，得到至少包含测试用例表示；通过检索算法对测试用例进行第一排序，得到初排测试集；以及第二排序，所述第二排序包含筛选排序后的初排测试集用于作为模型的训练集；将经过训练集训练后的模型对所述初排测试集进行第二排序，得到测试用例优先级排序结果。2.如权利要求1所述的方法，其特征在于，所述目标代码还包含更改程序代码；在第一排序中，更改程序代码经过词元化处理得到更改程序代码表示；在第二排序中，在训练模型时，训练内容包含学习更改程序代码和测试用例的语义表示；其中，所述更改程序代码与测试用例的对应关系为：1个更改程序代码表示Q对应于m个测试用例表示，m为整数，且m大于等于1。3.如权利要求2所述的方法，其特征在于，得到至少包含测试用例表示，获取步骤包括以下步骤：使用python语言的Javalang对测试用例代码进行语法和词法分析，并建立抽象语法树对代码进行结构化表示；遍历抽象语法树提取标识符；根据长标识符分割规则将长标识符分成单个词素；过滤无意义的词汇和停止词，得到由词元组成的测试用例表示。4.如权利要求2所述的方法，其特征在于，当更改程序代码表示或测试用例表示出现重复词元时；对词元的唯一性进行评估，包括可选择的进行以下操作：1)保持词元唯一性；对更改程序代码表示或测试用例表示中的词元进行去重，以保持集合中每种标记的唯一性；2)保持原词的出现频率；允许词元的重复出现，并记录更改程序代码表示和测试用例表示中词元出现的词频。5.如权利要求2所述的方法，其特征在于，在第一排序，通过检索算法对测试用例进行第一排序，得到初排测试集中，包含以下操作：给定一个更改程序代码，检索算法采用BM25算法来计算更改程序代码与每个测试用例之间的相似度得分，然后根据BM25算法得分对测试用例进行排序；在第一排序得到...

【专利技术属性】
技术研发人员：李英玲，王子翱，王俊杰，
申请(专利权)人：西南民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人