小編給大家分享一下如何解決Python采集網頁時正則表達式匹配換行符的問題,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #這樣采集html時出錯,采集不到數據,正則中 . 是不能匹配換行符,改成如下: p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 這是我們寫的正則表達式規則,你現在可以不理解啥意思
[\s\S]
\s
匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等價于[^ \f\n\r\t\v]。
看完了這篇文章,相信你對“如何解決Python采集網頁時正則表達式匹配換行符的問題”有了一定的了解,如果想了解更多相關知識,歡迎關注創新互聯行業資訊頻道,感謝各位的閱讀!
分享題目:如何解決Python采集網頁時正則表達式匹配換行符的問題-創新互聯
地址分享:http://www.2m8n56k.cn/article28/jejcp.html
成都網站建設公司_創新互聯,為您提供微信小程序、網站維護、網站建設、網頁設計公司、外貿建站、云服務器
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:[email protected]。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯