基于智能有限自动机的正则表达式匹配方法组成比例

技术编号：6532489 阅读：402 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于智能有限自动机(Smart?Finite?Automaton，SFA)的正则表达式匹配方法：选取合适的正则表达式规则集；构建智能有限自动机；通过智能有限自动机匹配方法对每个读入的测试集分别进行字符串匹配，并对匹配结果进行统计。实验结果表明，与XFA相比，SFA在存储空间开销上减少了44.1％，在存储器访问次数上减少了69.1％，提高了正则表达式匹配的时空效率。解决了XFA存在的冗余迁移边问题，能够有效的节省存储空间，同时也提高了XFA的性能。为当前网络带宽和业务流量迅猛增长环境下，正则表达式匹配方法应用时面临的线速数据包处理的吞吐量要求和存储空间需求提供了一种行之有效的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电子计算机网络技术，具体是一种。
技术介绍
N ^ Λ If ^ IlJ % K fp % 统(Network Intrusion Detection and PreventionSystems, NIDS/NIPS)是网络安全防御的重要手段，即通过实时监测网络流量，检查每个数据包的头部信息和有效载荷(即数据包内容)，识别和阻断网络可疑行为。 NIDS/NIPS的核心是深度数据包检测(De印Packet Inspection, DPI)，即采用特征匹配算法，将每个数据包内容与一组预定义的特征进行匹配。DPI技术不仅应用于NIDS/NIPS，而且还应用于应用层数据包分类、P2P流量识别、基于内容的流量计费等。特征匹配算法可分为字符串匹配算法和正则表达式匹配算法。由于正则表达式具有丰富灵活的表达能力，当前的主流NIDS/NIPS，例如Snort [2]、Bro [3]、TippingPoint IPSXicso IOS IPS等，已采用正则表达式来描述复杂攻击特征，以及采用正则表达式匹配算法来替代字符串匹配算法。正则表达式匹配算法采用有限自动机来表示一组已知攻击的特征正则表达式。有限自动机分为确定型有限自动机(Deterministic Finite Automata, DFA)和非确定型有限自动机(Nondeterministic Finite Automata，NFA)。DFA 具有时间高效等优点，即匹配速度快，但是存在存储空间开销大等缺点；而NFA具有存储空间高效等优点，但是存在匹配速度慢等缺点。如何设计一种时空高效的有限自动机成为正则表...

【技术保护点】
１．一种基于智能有限自动机的正则表达式匹配方法，其特征在于，该方法为：１）选取合适的正则表达式规则集；２）构建智能有限自动机；３）通过智能有限自动机匹配方法对每个读入的测试集分别进行字符串匹配，并对匹配结果进行统计。

【技术特征摘要】
1.一种基于智能有限自动机的正则表达式匹配方法，其特征在于，该方法为1)选取合适的正则表达式规则集；2)构建智能有限自动机；3)通过智能有限自动机匹配方法对每个读入的测试集分别进行字符串匹配，并对匹配结果进行统计。2.根据权利要求1所述的基于智能有限自动机的正则表达式匹配方法，其特征在于，所述的正则表达式规则集选取方法为，采用100个规则集，每个规则集包含100条形式为{. *SubStrl. *SubStr2. . . . *SubStrN}的正则表达式，其中子串 SubStrl、SubStr...

【专利技术属性】
技术研发人员：李彦彪，徐析，张洁坤，黄昆，
申请(专利权)人：湖南亿谷信息科技发展有限公司，
类型：发明
国别省市：43

全部详细技术资料下载我是这个专利的主人