Ruby正则表达式书写方法介绍

在编写puppet的pp文件中,会用到很多ruby的正则表达式,这里给予总结。

正则表达式Regexp

{}: 重复次数(如 {4}表示前面的会重复出现恰好4次)
{m,n}: 前面元素最少出现m次,最多出现n次
[]: 范围描述符(如 [a-z]表示在a-z范围内的一个字母)
\w: 字符或数字,相当于[0-9A-Za-z]
\W: 非字母或数字
\s: [\t\n\r\f]空字符,相当于[\t\n\r\f]
\S: 非空字符
\d: [0-9]数字,相当于[0-9]
\D: 非数字字符
*: 前面元素出现0次或多次
+: 前面元素出现1次或多次
?: 前面元素最多出现1次
|:与前面或后面的表达式匹配
\b: 退格符(0x08)(仅在范围描述符内部时)
\b: 字边界(word boundary)(在范围描述符外部时)
\B: 非字边界

##定义正则表达式

语法 三种表示方法

r1 = Regexp.new('[Rr]uby')
r2 = /[Rr]uby/
r3 = %r{[Rr]uby}
puts "Ruby" =~ /[Rr]uby/   #匹配返回位置
puts "Ruby" =~ /ruby/i   #匹配,不区分大小写
puts "I love ruby" =~ Regexp.new('[Rr]uby')   #匹配返回位置
puts "hello" =~ %r{[Rr]uby}  #不匹配返回nil

查找、替换

查找语法: str.scan(pattern) 返回匹配结果的数组
查找语法: str.scan(pattern) { |match, …| block } 返回对匹配的结果进行迭代

示例

str = <<HERE
  This is a test docment.
  It contains a lot of date string like 2008-01-02.
  It's created at 2008-03-21.
HERE
r = /(\d{4})-(\d{2})-(\d{2})/
r1 = /\d{4}-\d{2}-\d{2}/
matches = str.scan(r)
puts matches
puts str.scan(r1)
str.scan(r) do |year, mouth, day|
  puts "#{year}年#{mouth}月#{day}日"
end

常见的正则表达式示例

=begin
非负整数(正整数+0): ^\d+$
正整数:    ^[0-9]*[1-9][0-9]*$
非正整数(负整数+0): ^((-\d+)|(0+))$
由26个英文字母组成的字符串: ^[A-Za-z]+$
由数字和26个英文字母组成的字符串: ^[A-Za-z0-9]+$
E-mail地址:   ^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
年-月-日:
中文字符: [\u4e00-\u9fa5]
双字节字符(包括汉字在内): [^\x00-\xff]
HTML标记: /<.*>.*<\/\1>|<.*>\/>/
账号是否合法(字母开头,允许5-16个字节,允许字母数字下划线): ^[A-Za-z][a-zA-Z0-9_]{4,15}$
电话号码: (\d{3}-|\d{4}-)?(\d{8}|\d{7})?
腾讯QQ号: ^[1-9]*[1-9][0-9]*$

交流方式:

微信公众号:puppet2014,可微信搜索加入,也可以扫描以下二维码进行加入

微信公众号

QQ交流群:296934942

QQ交流群