乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      程序員學(xué)習(xí)—學(xué)會使用Python爬蟲正則表達(dá)式

       flyk0tcfb46p9f 2019-05-19

      此次課程我們會系統(tǒng)的學(xué)習(xí)一下python的正則表達(dá)式,以及可以根據(jù)自己的需求寫出正確的正則表達(dá)式。2學(xué)習(xí)此次課程,需要多久?15-20分鐘,建議每個表達(dá)式跟著實踐一下,加深印象3課程內(nèi)容

      Python中正則表達(dá)式 在 re 模塊 — Regular expression operations

      Python中的re模塊提供與Perl類似的正則表達(dá)式匹配操作,但是要注意的是:正則匹配時 表達(dá)式和要查詢的字符串可以是 unicode字符串,也可是8-bit 字符串,但是兩種模式不可以混合使用,也就是說 表達(dá)式和要查詢的字符串必須一致。

      正則表達(dá)式特殊字符:

      .(點): 默認(rèn)模式下,.可以匹配除了換行外的所有字符,如果需要匹配換行,可以傳參 re.DOTALL。

      image

      運行結(jié)果:

      image

      ^:只匹配字符串的開始位置,可以使用re.MULTILINE(匹配多行),匹配每一行的開始位置。

      image

      代碼中每一行的開頭都有ae字符串,所以開啟多行模式后,會匹配兩個結(jié)果。

      運行結(jié)果:

      image

      $ : 與^相反,匹配字符串的結(jié)束位置,可以使用re.MULTILINE(匹配多行),匹配每一行的結(jié)尾位置。

      image

      運行結(jié)果:

      image

      .: 匹配0個或多個的表達(dá)式

      image

      運行結(jié)果:

      image

      分析:c*表示,匹配字符'c'0次或者多次,也就是說會匹配 a,ac。

      +: 匹配1個或多個的表達(dá)式

      image

      運行結(jié)果:

      image

      分析:匹配字符a并且c一次或者多次,所以會匹配ac或者accccc

      ? : 匹配0次或1次,非貪婪方式

      image

      運行結(jié)果:

      分析:表達(dá)式“ac?” 匹配字符a或者ac(?只匹配0次或者1次,比較懶惰,不像上面的+或者*會匹配多次)

      .? : 這三個特殊符號上面都講過了,.是匹配任意字符匹配0次或者多次,連在一起使用也就是匹配全文了,加上?號,非貪婪模式匹配,將盡可能少的匹配結(jié)果。

      image

      匹配結(jié)果:

      image

      4小結(jié)正則匹配的語法是通用的,大家學(xué)會這些特殊字符,無論什么語言都能迅速入門。所以有必要好好學(xué)習(xí)一下。

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻(xiàn)花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多