强大的Perl正则表达式实例详解

脚本专栏 2024/11/20 佚名

3 2 1

圆月山庄资源网 Design By www.vgjia.com

一、介绍

正则表达式各语言都有自己的规范，但是基本都差不多，都是由元字符的组合来进行匹配；由于Nmap内嵌的服务与版本探测是使用的Perl正则规范，因此此篇博客记录一下Perl正则的相关内容，方便后期查阅。

二、Perl正则例子

下面的例子可能有不足之处，有些来源于博客，没有验证；

1. 匹配IP地址：\d+\.\d+\.\d+\.\d+

\d:匹配一个数字字符,\d+:匹配一次或多次数字字符。

\.:使用转义字符匹配'.'。

2. 匹配邮箱类似于123456@qq.com： /^[a-zA-Z0-9_\-.]+@[a-zA-Z0-9_\-]+.[a-zA-Z]+$/

　　　　　　　　^: 匹配开头

　　　　　　　　$: 匹配结尾，这两个保证了这是连续的一串字符。

3. 匹配数字：m/^[0-9]+$/

　　　　　　　由^开头由$结尾保证了只含有数字，如果只有结尾$,那么abc12这种也是可以的。

　　　　　　　可用在输入校验，校验输入的是否是数字。

4. 用户输入温度（华氏温度，摄氏温度），编程进行转换

　　　　m/^([-+]"Windows 3.1" 中的 "Windows"，但不能匹配


　　　　　　　　　　"Windows 2000" 中的 "Windows"。


9. 匹配数字：


　　^\d+(\.\d+)"service":"nutcracker", "source":"ubuntu", "version":"0.3.0",


　     　m|^\{"service":"nutcracker", "source":"([^"]+)", "version":"([\d.]+)",|


　　2）：220 yzwb.net ESMTP MDaemon 10.1.2; 


　　　　 m|^220[ -]([-.\w]+) ESMTP MDaemon (\d[-.\w]+);


　　3）：AMQP\x01\x01\x00\n


　　　　 m|^AMQP\x01\x01\x00\x0a$|:注意回车键\n对应16进制\x0a,\r对应\x0d.


　　Nmap nmap-services-probe文件给出的匹配


三、正则元字符
元字符是正则表达式组成的基本元素。


  
    
      字符
      描述
    
    
            将下一个字符标记为一个特殊字符、或一个原义字符、或一个 后向引用、或一个八进制转义符。例如，'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。
    
    
      ^
      匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配 '\n' 或 '\r' 之后的位置。
    
    
      $
      匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性，$ 也匹配 '\n' 或 '\r' 之前的位置。
    
    
      *
      匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。 * 等价于{0,}。
    
    
      +
      匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。
    
    
      "do(es)" 可以匹配 "do" 或 "does" 中的"do" 。"Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。
    
    
      {n,}
      n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
    
    
      {n,m}
      m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。刘， "o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o"oooo"，'o+"o"，而 'o+' 将匹配所有 'o'。
    
    
      .
      匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用象 '[.\n]' 的模式。
    
    
      (pattern)
      匹配pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合得到，在VBScript 中使用 SubMatches 集合，在Visual Basic Scripting Edition 中则使用 $0…$9 属性。要匹配圆括号字符，请使用 '′或′'。
    
    
      ("或" 字符 (|) 来组合一个模式的各个部分是很有用。例如， 'industr("Windows 2000" 中的 "Windows" ，但不能匹配 "Windows 3.1" 中的 "Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。
    
    
      ("Windows 3.1" 中的 "Windows"，但不能匹配 "Windows 2000" 中的 "Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始
    
    
      x|y
      匹配 x 或 y。例如，'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food"。
    
    
      [xyz]
      字符集合。匹配所包含的任意一个字符。例如， '[abc]' 可以匹配 "plain" 中的 'a'。
    
    
      [^xyz]
      负值字符集合。匹配未包含的任意字符。例如， '[^abc]' 可以匹配 "plain" 中的'p'。
    
    
      [a-z]
      字符范围。匹配指定范围内的任意字符。例如，'[a-z]' 可以匹配 'a' 到 'z' 范围内的任意小写字母字符。
    
    
      [^a-z]
      负值字符范围。匹配任何不在指定范围内的任意字符。例如，'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范围内的任意字符。
    
    
      \b
      匹配一个单词边界，也就是指单词和空格间的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。
    
    
      \B
      匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。
    
    
      \cx
      匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。 x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
    
    
      \d
      匹配一个数字字符。等价于 [0-9]。
    
    
      \D
      匹配一个非数字字符。等价于 [^0-9]。
    
    
      \f
      匹配一个换页符。等价于 \x0c 和 \cL。
    
    
      \n
      匹配一个换行符。等价于 \x0a 和 \cJ。
    
    
      \r
      匹配一个回车符。等价于 \x0d 和 \cM。
    
    
      \s
      匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
    
    
      \S
      匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
    
    
      \t
      匹配一个制表符。等价于 \x09 和 \cI。
    
    
      \v
      匹配一个垂直制表符。等价于 \x0b 和 \cK。
    
    
      \w
      匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。
    
    
      \W
      匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。
    
    
      \xn
      匹配 n，其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如， '\x41' 匹配 "A"。'\x041' 则等价于 '\x04' & "1"。正则表达式中可以使用 ASCII 编码。.
    
    
      \num
      匹配 num，其中 num 是一个正整数。对所获取的匹配的引用。例如，'(.)\1' 匹配两个连续的相同字符。
    
    
      \n
      标识一个八进制转义值或一个后向引用。如果 \n 之前至少 n 个获取的子表达式，则 n 为后向引用。否则，如果 n 为八进制数字 (0-7)，则 n 为一个八进制转义值。
    
    
      \nm
      标识一个八进制转义值或一个后向引用。如果 \nm 之前至少有is preceded by at least nm 个获取得子表达式，则 nm 为后向引用。如果 \nm 之前至少有 n 个获取，则 n 为一个后跟文字 m 的后向引用。如果前面的条件都不满足，若  n 和 m 均为八进制数字 (0-7)，则 \nm 将匹配八进制转义值 nm。
    
    
      \nml
      如果 n 为八进制数字 (0-3)，且 m 和 l 均为八进制数字 (0-7)，则匹配八进制转义值 nml。
    
    
      \un
      匹配 n，其中 n 是一个用四个十六进制数字表示的 Unicode 字符。例如， \u00A9 匹配版权符号 ("color: #ff0000">利用上述元字符，可以组合出所有想要的匹配模式。下面介绍几个常用的正则表达式.


匹配中文字符的正则表达式： [\u4e00-\u9fa5] 
评注：匹配中文还真是个头疼的事，有了这个表达式就好办了


匹配双字节字符(包括汉字在内)： [^\x00-\xff]


评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）


匹配空白行的正则表达式：\n\s*\r


评注：可以用来删除空白行


匹配HTML标记的正则表达式： <(\S*"htmlcode">

^[1-9]\d*$　 　 //匹配正整数

^-[1-9]\d*$ 　 //匹配负整数

^-"htmlcode">

^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串

^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串

^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串

^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串

^\w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串


四、总结
　　1）不同的场景、不同的语言，正则会有些许差别，只要掌握住基本的元字符以及相应的语言特性，真正用的时候花10几分钟时间熟悉一两个例子就能上手。
　　2）Perl正则是目前最优的，包括特性，建议读者学一学，这对处理数据有很大的好处。
　　3）在我理解，我们如果只是想达到我们抽取数据的目的，正则匹配的原理没有必要搞懂，会用就行。
好了，以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对的支持。


                                
                                    perl正则表达式,捕获,perl,匹配@,perl,~s 
                                
                                    标签：
                                        perl正则表达式,捕获,perl,匹配@,perl,~s
                                     

                                圆月山庄资源网 Design By www.vgjia.com


                        
                            
                                广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）

                                免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！
                                如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com
                            
                        
                        
                            
                                
                                    上一篇
                                    Perl5和Perl6对比使用Sigils的差别
                                
                            
                            
                                
                                    下一篇
                                    perl uc,lc,ucfirst,lcfirst大小写转换函数
                                
                            
                        
                        
                        圆月山庄资源网 Design By www.vgjia.com
                        
                            
                                
                                
                                    评论“强大的Perl正则表达式实例详解”
                                
                            
                            
                                
                                    
                                        
                                            
                                                
                                                    
                                                
                                                
                                                    
                                                
                                                
                                                    
                                                    
                                                    
                                                
                                                
                                                     再想想
                                                    
                                                    
                                                    
                                                    
                                                    
                                                
                                            
                                            
                                        
                                    
                                    
                                    
                                        暂无评论...


                    
                        
                            
                                
                                    
                                        
                                    
                                    
                                        
                                            
                                        
                                    
                                
                                
                                    www.vgjia.com
                                            
                                                圆月山庄资源网 
                                    
                                    
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                    
                                    
                                    
                                        
                                            139,976互联网资源
                                        
                                        
                                            144,792高清电影
                                        
                                        
                                            21,817无损音乐
                                        
                                        
                                            631,128技术资源
                                        
                                    
                                
                            
                            
                                最新文章
                                
                                    
                                         
                                       
                                            
                                                
                                            
                                            
                                                
                                                    转载一个别人收藏的精典网站Ruby,HIBERNATE
                                                
                                                
                                                    
                                                        2024/11/20
                                                        
                                                         56
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    可与Spreadsheets媲美的在线表格系统:EditG
                                                
                                                
                                                    
                                                        2024/11/20
                                                        
                                                         34
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    cygwin使用心得
                                                
                                                
                                                    
                                                        2024/11/20
                                                        
                                                         73
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    脚本的DVD开发
                                                
                                                
                                                    
                                                        2024/11/20
                                                        
                                                         28
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    局域网设置自动配置脚本文件的写法与用途
                                                
                                                
                                                    
                                                        2024/11/20
                                                        
                                                         15


            
            
                
                    
                        
                            更新日志
                        
                        
                            
                                
                                    2024年11月20日
                                
                                                    
                        
 
                            【发烧试音】蔡克信严讯人间天籁》[原抓WAV+CUE]
 
                            [ABC唱片]山姆泰勒《西电之声·萨克斯风》[低速原抓WAV+CUE]
 
                            童丽《微风细雨XRCD2》[原抓WAV+CUE]
 
                            群星 《车乐坊1》DTS魔音[WAV+CUE][1.7G]
 
                            邓丽君.2024 -《生誕70年ベスト?アルバム 沒後30年》环球日版 [WAV+分轨][993M]

                        
                    
                    
                        2024年11月20日
                    
                    
                        
 
                            群星《一人一首成名曲》1998 台湾金碟珍藏版[WAV+CUE][1.1G]
 
                            陈百强2024-《凝望》头版限量编号MQA-UHQCD[WAV+CUE]
 
                            测试示范《监听天碟3》头版限量编号LECD[WAV+CUE]
 
                            陈瑞《爱你到天荒地老HQ》头版限量[低速原抓WAV+CUE]
 
                            徐小凤 《徐小凤殿堂18首》24K金碟[WAV+CUE]
 
                            保时捷原厂车载爆棚动态试音碟《Panamera_Soundtrack》DTS[WAV分轨][1G]
 
                            容祖儿《小小》香港首版 [WAV+CUE][1.1G]
 
                            莫文蔚《拉活…》SONY [WAV+CUE][1G]
 
                            Beyond《极品天碟》LPCD45II首批限量版[WAV+CUE][1.7G]
 
                            HIFI示范巅峰之作《情解药·Hi-Fi心魂》2CD[WAV+CUE]
 
                            房东的猫2021-关于彻夜不眠的事情（EP）[青柴文化][WAV+CUE]
 
                            群星.1993-一曲成名·青春无悔【飞碟】【WAV+CUE】
 
                            张芸京.2016-失败的高歌【泡耳音乐】【WAV+CUE】
 
                            天籁女声《2024第31届上海国际高端音影展纪念CD》[WAV+CUE][1.1G]
 
                            姚斯婷 《敢爱敢做》头版限量编号24K金碟[低速原抓WAV+CUE][1.2G]

                        
                    
                            
                        
                    
                
            
            
                
                    友情链接 
                
                    
                        杰晶网络
                        DDR爱好者之家
                        桃源资源网
                        杰网资源
                        富贵资源网
                        南强小屋
                        铁雪资源网
                        幽灵资源网
                        万梅资源网
                        狼山资源网
                        白云岛资源网
                        昆仑资源网
                        相思资源网
                        明霞山资源网
                        内蒙古资源网
                        黑松山资源网
                        茶园资源网
                        饿虎岗资源网
                        大旗谷资源网
                        常春岛资源网
                        岱庙资源网
                        兴国资源网
                        快活林资源网
                        蝙蝠岛资源网
                        帝王谷资源网
                        白云城资源网
                        伏龙阁资源网
                        清风细雨楼
                        天枫庄资源网
                        圆月山庄资源网
                        无争山庄资源网
                        神水资源网
                        移花宫资源网
                        神剑山庄资源网
                        无为清净楼资源网
                        金钱帮资源网
                        丐帮资源网
                        华山资源网
                        极乐门资源网
                        小李飞刀资源网
                        凤求凰客栈
                        风云阁资源网
                        金狮镖局
                        鸳鸯亭资源网
                        千金楼资源网
                        更多链接
                    
                
            
            
                
                    
                        
                    
                    
                        
                    
                
                
                    
                        Copyright © 2006~2023
                        圆月山庄资源网   Design by www.vgjia.com  手机版