【原】正則表達式

流楚丶格念 2022-01-14

展開全文

文章目錄

正則表達式

正則表達式簡介

什么是正則表達式

正則表達式：用于匹配規(guī)律規(guī)則的表達式，正則表達式最初是科學家對人類神經(jīng)系統(tǒng)的工作原理的早期研究，現(xiàn)在在編程語言中有廣泛的應用。正則表通常被用來檢索、替換那些符合某個模式(規(guī)則)的文本。
正則表達式是對字符串操作的一種邏輯公式，就是用事先定義好的一些特定字符、及這些特定字符的組合，組成一個“規(guī)則字符串”，這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。

正則表達式的作用

給定的字符串是否符合正則表達式的過濾邏輯(匹配)
可以通過正則表達式，從字符串中獲取我們想要的特定部分(提取)
強大的字符串替換能力(替換)

正則表達式的特點

靈活性、邏輯性和功能性非常的強
可以迅速地用極簡單的方式達到字符串的復雜控制
對于剛接觸的人來說，比較晦澀難懂

正則表達式的測試

在線測試正則
工具中使用正則表達式
- sublime/vscode/word
- 演示替換所有的數(shù)字

正則表達式的組成

普通字符
特殊字符(元字符)：正則表達式中有特殊意義的字符

示例演示：

\d 匹配數(shù)字
ab\d 匹配 ab1、ab2

元字符串

通過測試工具演示下面元字符的使用

常用元字符串

元字符	說明
\d	匹配數(shù)字
\D	匹配任意非數(shù)字的字符
\w	匹配字母或數(shù)字或下劃線
\W	匹配任意不是字母，數(shù)字，下劃線
\s	匹配任意的空白符
\S	匹配任意不是空白符的字符
.	匹配除換行符以外的任意單個字符
^	表示匹配行首的文本(以誰開始)
$	表示匹配行尾的文本(以誰結(jié)束)

限定符

限定符	說明
*	重復零次或更多次
+	重復一次或更多次
?	重復零次或一次
{n}	重復n次
{n,}	重復n次或更多次
{n,m}	重復n到m次

其它

[] 字符串用中括號括起來，表示匹配其中的任一字符，相當于或的意思
[^]  匹配除中括號以內(nèi)的內(nèi)容
\ 轉(zhuǎn)義符
| 或者，選擇兩者中的一個。注意|將左右兩邊分為兩部分，而不管左右兩邊有多長多亂
() 從兩個直接量中選擇一個，分組
   eg：gr(a|e)y匹配gray和grey
[\u4e00-\u9fa5]  匹配漢字

案例

驗證手機號：

^\d{11}$

驗證郵編：

^\d{6}$

驗證日期 2012-5-01

^\d{4}-\d{1,2}-\d{1,2}$

驗證郵箱 xxx@itcast.cn：

^\w+@\w+\.\w+$

驗證IP地址 192.168.1.10

^\d{1,3}\(.\d{1,3}){3}$

正則代碼使用

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <title>title</title>
  <script>

    /*
    *
    * 正則表達式:也叫規(guī)則表達式,按照一定的規(guī)則組成的一個表達式,這個表達式的作用主要是匹配字符串的,
    * "我的電話:10086,他的電話:10010,你的電話:10000" 正則表達式,把這個字符串中的所有的數(shù)字找到
    *
    * 正則表達式的作用:匹配字符串的
    *
    * 在大多數(shù)編程語言中都可以使用
    *
    * 正則表達式的組成:是由元字符或者是限定符組成的一個式子
    *
    *
    * 元字符:
    *
    * .  表示的是:除了\n以外的任意的一個字符   "fdsfs238"
    *
    * [] 表示的是:范圍,  [0-9] 表示的是0到9之間的任意的一個數(shù)字,  "789" [0-9]
    * [1-7] 表示的是1到7之間的任意的一個數(shù)字
    * [a-z] 表示的是:所有的小寫的字母中的任意的一個
    * [A-Z] 表示的是:所有的大寫的字母中的任意的一個
    * [a-zA-Z] 表示的是:所有的字母的任意的一個
    * [0-9a-zA-Z] 表示的是: 所有的數(shù)字或者是字母中的一個
    * [] 另一個函數(shù): 把正則表達式中元字符的意義干掉    [.] 就是一個.
    * | 或者     [0-9]|[a-z] 表示的是要么是一個數(shù)字,要么是一個小寫的字母
    * () 分組 提升優(yōu)先級   [0-9]|([a-z])|[A-Z]
    * ([0-9])([1-5])([a-z]) 三組, 從最左邊開始計算
    * (()(()))
    *
    *
    * 都是元字符,但是也可以叫限定符,下面的這些
    *    *   表示的是:前面的表達式出現(xiàn)了0次到多次
    *    [a-z][0-9]* 小寫字母中的任意一個 后面是要么是沒有數(shù)字的,要么是多個數(shù)字的
    *    "fdsfs3223323"  [a-z][0-9]*
    *
    *    +  表示的是:前面的表達式出現(xiàn)了1次到多次
    *    [a-z][9]+  小寫字母一個后面最少一個9,或者多個9
    *    "fesfewww9fefds"
    *
    *    ?  表示的是:前面的表達式出現(xiàn)了0次到1次,最少是0次,最多1次 ,另一個含義:阻止貪婪模式
    *    [4][a-z]? "1231234ij"
    *  限定符:限定前面的表達式出現(xiàn)的次數(shù)
    *  {} 更加的明確前面的表達式出現(xiàn)的次數(shù)
    *  {0,} 表示的是前面的表達式出現(xiàn)了0次到多次,和 *一樣的
    *  {1,} 表示的是前面的表達式出現(xiàn)了1次到多次,和 +一樣的
    *  {0,1} 表示的是前面的表達式出現(xiàn)了0次到1次,和 ?一樣的
    *  {5,10} 表示的是前面的表達式出現(xiàn)了5次到10次
    *  {4} 前面的表達式出現(xiàn)了4次
    *  {,10} 錯誤的========不能這么寫
    *  ^ 表示的是以什么開始,或者是取非(取反) ^[0-9] 以數(shù)字開頭
    *  ^[a-z] 以小寫字母開始
    *  [^0-9] 取反,非數(shù)字
    *  [^a-z] 非小寫字母
    *  [^0-9a-zA-Z_]
    *  $ 表示的是以什么結(jié)束   [0-9][a-z]$  必須以小寫字母結(jié)束
    *  ^[0-9][a-z] 相當于是嚴格模式   "3f2432e"  "4f"
    *   \d 數(shù)字中的任意一個,
    *   \D 非數(shù)字中的一個
    *   \s 空白符中的一個
    *   \S 非空白符
    *   \w 非特殊符號
    *   \W 特殊符號
    *   \b 單詞的邊界
    *   "what are you no sha lei"
    *
    *
    *
    *
    *
    *
    *    . 除了\n以外的任意一個單個字符
    *    []  范圍
    *    () 分組,提升優(yōu)先級
    *    | 或者
    *    * 0-多次
    *    + 1-多次
    *    ? 0-1次
    *    {0,} 和*一樣
    *    {1,} 和+
    *    {0,1} 和?
    *
    *    \d 數(shù)字中的一個
    *    \D 非數(shù)字
    *    \s 空白符
    *    \S 非空白符
    *     \W  特殊符號
    *     \w 非特殊符號 _
    *     ^ 取反,以什么開始
    *     $ 以什么結(jié)束
         *
         *     \b 單詞邊界
    *
    *
    *
    * */
  </script>
</head>
<body>



</body>
</html>