轉(zhuǎn)載地址:https://www.cnblogs.com/zhangxinqi/p/9210211.html 最近在看html頁(yè)面解析的東西,html解析可以用beautifulsoup 或者lxml,lxml是python的一個(gè)解析庫(kù),支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高 XPath,全稱XML Path Language,即XML路徑語(yǔ)言,它是一門在XML文檔中查找信息的語(yǔ)言,它最初是用來(lái)搜尋XML文檔的,但是它同樣適用于HTML文檔的搜索 XPath的選擇功能十分強(qiáng)大,它提供了非常簡(jiǎn)明的路徑選擇表達(dá)式,另外,它還提供了超過100個(gè)內(nèi)建函數(shù),用于字符串、數(shù)值、時(shí)間的匹配以及節(jié)點(diǎn)、序列的處理等,幾乎所有我們想要定位的節(jié)點(diǎn),都可以用XPath來(lái)選擇 這里寫博客記錄下,留著備用 https://www.cnblogs.com/zhangxinqi/p/9210211.html |
|
來(lái)自: Four兄 > 《Python筆記》