System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,具体来说,涉及一种基于人工智能对伪装应用程序进行识别的方法及装置。
技术介绍
1、当前市场上涌现了大量伪装app(应用程序),尽管存在专门的审核人员,然而由于无法深入了解每个产品的细节,他们难以通过ui直观地判定一个app是否伪装。由于人工审核效率较低且容易存在错判、误判等问题,导致伪装app得以在市场上流通,给使用者的信息安全和财产安全带来隐患。
技术实现思路
1、鉴于现有技术的不足,提供一种基于人工智能对伪装应用程序进行识别的方法和装置。本专利技术旨在通过基于深度学习的程序自动化检测技术,深入分析app的实际功能,判断是否存在伪装行为,以解决人工审核无法深入了解每个app的问题,提高整个应用生态系统的质量和安全性。
2、本专利技术采用的技术手段如下:
3、一种基于人工智能对伪装应用程序进行识别的方法,包括:
4、获取待识别app在审核过程中提交的功能描述文档,对所述功能描述文档进行基于自然语言处理与图像处理的特征提取,构建第一app功能介绍列表;
5、对待识别app的可执行文件进行反编译,从而生成汇编代码,基于预训练的代码-功能模型对所述汇编代码段进行处理,生成第二app功能介绍列表,包括将与功能相关的代码指令输入训练后的bert语言模型提取指令的高级语义嵌入特征,将切片后的高级语义嵌入特征和结构特征输入到基于图神经网络的功能提取模型,进行函数语义推断,提取具有高级语义信息的功能表示,从而生成第二app功能介
6、通过相似性分析判断第一app功能介绍列表和第二app功能介绍列表的一致性,基于一致性判定结果确定app是否伪装。
7、进一步地,对所述功能描述文档进行基于自然语言处理与图像处理的特征提取,构建第一app功能介绍列表,包括:
8、基于功能描述文档获取文字模态信息和图像模态信息;
9、对所述文字模态信息进行预处理,基于预训练的语言模型对预处理后的文字模态信息进行语义分析,获取语义特征;
10、基于预训练的图像特征提取模型对所述图像模态信息进行特征提取,获取图像特征;
11、对所述语义特征和图像特征进行特征融合,对所述功能描述文档进行关键词提取和主题建模,形成具有高级语义特征的第一app功能介绍列表。
12、进一步地,对待识别app的可执行文件进行反编译,从而生成汇编代码,包括:
13、利用静态代码分析技术,删除汇编代码中与主要功能无关的代码段,包括采用控制流和数据流分析来保留与功能相关的代码。
14、进一步地,对所述bert语言模型进行预训练,包括:
15、通过指令规范化对指令数据进行预处理,利用规范化的汇编指令构建训练文本库;
16、采用mlm预训练任务对bert语言模型进行预训练,使其学习汇编指令的特性。
17、本专利技术还公开了一种基于人工智能对伪装应用程序进行识别的装置,用于执行上述方法,包括:
18、描述功能列表获取单元,其用于获取待识别app在审核过程中提交的功能描述文档,对所述功能描述文档进行基于自然语言处理与图像处理的特征提取,构建第一app功能介绍列表;
19、实际功能列表获取单元,其用于对待识别app的可执行文件进行反编译,从而生成汇编代码,基于预训练的代码-功能模型对所述汇编代码段进行处理,生成第二app功能介绍列表;
20、对比单元,其用于通过相似性分析判断第一app功能介绍列表和第二app功能介绍列表的一致性,基于一致性判定结果确定app是否伪装。
21、较现有技术相比,本专利技术具有以下优点:
22、1、本专利技术通过引入二进制代码分析技术,改进传统的应用审核方式,提高审核的效率和准确性。降低恶意软件和伪装app通过审核的可能性。
23、2、本专利技术有效保护用户免受伪装app的欺诈行为。通过准确判断app的实际功能,降低遭受欺骗的风险。
24、3、本专利技术通过系统的功能检测,可以及早发现并防止一些潜在的侵权行为。例如,对于介绍为图片处理软件而实际提供视频播放功能的情况,该系统能够及时发现并采取措施,从而维护视频制作公司的权益,减少原生应用面临的经济损失。
25、4、本专利技术通过改善应用审核方式,提高用户保护水平,以及防止侵权行为,该系统有望为应用商店带来多方面的有效收益,从而推动整个应用生态系统的健康发展。
本文档来自技高网...【技术保护点】
1.一种基于人工智能对伪装应用程序进行识别的方法,其特征在于,包括:
2.根据权利要求1所述的一种基于人工智能对伪装应用程序进行识别的方法,其特征在于,对所述功能描述文档进行基于自然语言处理与图像处理的特征提取,构建第一APP功能介绍列表,包括:
3.根据权利要求1所述的一种基于人工智能对伪装应用程序进行识别的方法,其特征在于,对待识别APP的可执行文件进行反编译,从而生成汇编代码,包括:
4.根据权利要求1所述的一种基于人工智能对伪装应用程序进行识别的方法,其特征在于,对所述bert语言模型进行预训练,包括:
5.一种基于人工智能对伪装应用程序进行识别的装置,用于执行如权利要求1所述的方法,其特征在于,包括:
【技术特征摘要】
1.一种基于人工智能对伪装应用程序进行识别的方法,其特征在于,包括:
2.根据权利要求1所述的一种基于人工智能对伪装应用程序进行识别的方法,其特征在于,对所述功能描述文档进行基于自然语言处理与图像处理的特征提取,构建第一app功能介绍列表,包括:
3.根据权利要求1所述的一种基于人工智能对伪装应用程序进行识别...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。