正則表達式
正則表達式簡介
什么是正則表達式
正則表達式:用于匹配規(guī)律規(guī)則的表達式,正則表達式最初是科學家對人類神經(jīng)系統(tǒng)的工作原理的早期研究,現(xiàn)在在編程語言中有廣泛的應用。正則表通常被用來檢索、替換那些符合某個模式(規(guī)則)的文本。
正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。
正則表達式的作用
- 給定的字符串是否符合正則表達式的過濾邏輯(匹配)
- 可以通過正則表達式,從字符串中獲取我們想要的特定部分(提取)
- 強大的字符串替換能力(替換)
正則表達式的特點
- 靈活性、邏輯性和功能性非常的強
- 可以迅速地用極簡單的方式達到字符串的復雜控制
- 對于剛接觸的人來說,比較晦澀難懂
正則表達式的測試
- 在線測試正則
- 工具中使用正則表達式
- sublime/vscode/word
- 演示替換所有的數(shù)字
正則表達式的組成
- 普通字符
- 特殊字符(元字符):正則表達式中有特殊意義的字符
示例演示:
\d
匹配數(shù)字ab\d
匹配 ab1、ab2
元字符串
通過測試工具演示下面元字符的使用
常用元字符串
元字符 | 說明 |
---|
\d | 匹配數(shù)字 |
\D | 匹配任意非數(shù)字的字符 |
\w | 匹配字母或數(shù)字或下劃線 |
\W | 匹配任意不是字母,數(shù)字,下劃線 |
\s | 匹配任意的空白符 |
\S | 匹配任意不是空白符的字符 |
. | 匹配除換行符以外的任意單個字符 |
^ | 表示匹配行首的文本(以誰開始) |
$ | 表示匹配行尾的文本(以誰結(jié)束) |
限定符
限定符 | 說明 |
---|
* | 重復零次或更多次 |
+ | 重復一次或更多次 |
? | 重復零次或一次 |
{n} | 重復n次 |
{n,} | 重復n次或更多次 |
{n,m} | 重復n到m次 |
其它
[] 字符串用中括號括起來,表示匹配其中的任一字符,相當于或的意思
[^] 匹配除中括號以內(nèi)的內(nèi)容
\ 轉(zhuǎn)義符
| 或者,選擇兩者中的一個。注意|將左右兩邊分為兩部分,而不管左右兩邊有多長多亂
() 從兩個直接量中選擇一個,分組
eg:gr(a|e)y匹配gray和grey
[\u4e00-\u9fa5] 匹配漢字
案例
驗證手機號:
^\d{11}$
驗證郵編:
^\d{6}$
驗證日期 2012-5-01
^\d{4}-\d{1,2}-\d{1,2}$
驗證郵箱 xxx@itcast.cn:
^\w+@\w+\.\w+$
驗證IP地址 192.168.1.10
^\d{1,3}\(.\d{1,3}){3}$
正則代碼使用
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>title</title>
<script>
/*
*
* 正則表達式:也叫規(guī)則表達式,按照一定的規(guī)則組成的一個表達式,這個表達式的作用主要是匹配字符串的,
* "我的電話:10086,他的電話:10010,你的電話:10000" 正則表達式,把這個字符串中的所有的數(shù)字找到
*
* 正則表達式的作用:匹配字符串的
*
* 在大多數(shù)編程語言中都可以使用
*
* 正則表達式的組成:是由元字符或者是限定符組成的一個式子
*
*
* 元字符:
*
* . 表示的是:除了\n以外的任意的一個字符 "fdsfs238"
*
* [] 表示的是:范圍, [0-9] 表示的是0到9之間的任意的一個數(shù)字, "789" [0-9]
* [1-7] 表示的是1到7之間的任意的一個數(shù)字
* [a-z] 表示的是:所有的小寫的字母中的任意的一個
* [A-Z] 表示的是:所有的大寫的字母中的任意的一個
* [a-zA-Z] 表示的是:所有的字母的任意的一個
* [0-9a-zA-Z] 表示的是: 所有的數(shù)字或者是字母中的一個
* [] 另一個函數(shù): 把正則表達式中元字符的意義干掉 [.] 就是一個.
* | 或者 [0-9]|[a-z] 表示的是要么是一個數(shù)字,要么是一個小寫的字母
* () 分組 提升優(yōu)先級 [0-9]|([a-z])|[A-Z]
* ([0-9])([1-5])([a-z]) 三組, 從最左邊開始計算
* (()(()))
*
*
* 都是元字符,但是也可以叫限定符,下面的這些
* * 表示的是:前面的表達式出現(xiàn)了0次到多次
* [a-z][0-9]* 小寫字母中的任意一個 后面是要么是沒有數(shù)字的,要么是多個數(shù)字的
* "fdsfs3223323" [a-z][0-9]*
*
* + 表示的是:前面的表達式出現(xiàn)了1次到多次
* [a-z][9]+ 小寫字母一個后面最少一個9,或者多個9
* "fesfewww9fefds"
*
* ? 表示的是:前面的表達式出現(xiàn)了0次到1次,最少是0次,最多1次 ,另一個含義:阻止貪婪模式
* [4][a-z]? "1231234ij"
* 限定符:限定前面的表達式出現(xiàn)的次數(shù)
* {} 更加的明確前面的表達式出現(xiàn)的次數(shù)
* {0,} 表示的是前面的表達式出現(xiàn)了0次到多次,和 *一樣的
* {1,} 表示的是前面的表達式出現(xiàn)了1次到多次,和 +一樣的
* {0,1} 表示的是前面的表達式出現(xiàn)了0次到1次,和 ?一樣的
* {5,10} 表示的是前面的表達式出現(xiàn)了5次到10次
* {4} 前面的表達式出現(xiàn)了4次
* {,10} 錯誤的========不能這么寫
* ^ 表示的是以什么開始,或者是取非(取反) ^[0-9] 以數(shù)字開頭
* ^[a-z] 以小寫字母開始
* [^0-9] 取反,非數(shù)字
* [^a-z] 非小寫字母
* [^0-9a-zA-Z_]
* $ 表示的是以什么結(jié)束 [0-9][a-z]$ 必須以小寫字母結(jié)束
* ^[0-9][a-z] 相當于是嚴格模式 "3f2432e" "4f"
* \d 數(shù)字中的任意一個,
* \D 非數(shù)字中的一個
* \s 空白符中的一個
* \S 非空白符
* \w 非特殊符號
* \W 特殊符號
* \b 單詞的邊界
* "what are you no sha lei"
*
*
*
*
*
*
* . 除了\n以外的任意一個單個字符
* [] 范圍
* () 分組,提升優(yōu)先級
* | 或者
* * 0-多次
* + 1-多次
* ? 0-1次
* {0,} 和*一樣
* {1,} 和+
* {0,1} 和?
*
* \d 數(shù)字中的一個
* \D 非數(shù)字
* \s 空白符
* \S 非空白符
* \W 特殊符號
* \w 非特殊符號 _
* ^ 取反,以什么開始
* $ 以什么結(jié)束
*
* \b 單詞邊界
*
*
*
* */
</script>
</head>
<body>
</body>
</html>