您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關怎么用Python 正則表達式識別樓主,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
識別樓主:
帖子代碼片段:<!-- 天涯百寶箱 -->
<script> var chrType = "public"; var intAuthorId = ""; var chrAuthorName = "GreyHouse"; var chrTitle = "[光影記錄]跳蚤的歐洲之行"; var chrItem = 'travel'; var intItem = '0'; var intArticleId = "191157"; var tAuthor = 'GreyHouse'; </script>
使用以下的Python 正則表達式來找到樓主:
rereg_louzhu = re.compile('.*chrAuthorName = "(.*?)"; '
設mat為reg_louzhu.match(網頁源碼html行);則mat.groups()[0] 為樓主名字 GreyHouse
識別一個帖子的起始位置
繼續分析html,發現天涯回帖一般都是用作者信息欄作為帖子的起始,那么帖子的尾部就是下一個作者信息欄之前咯。
<TABLE cellspacing=0 border=0 bgcolor=f5f9fa
width=100% ><TR><TD WIDTH=100 ALIGN=RIGHT
VALIGN=bottom></TD><TD><font size=-1
color=green><br><center>作者:<a
href="/browse/Listwriter.asp?vid=11288815&vwriter=
開著坦克逛街&idwriter=0&key=0" target=_blank>開著坦克逛街</a>
以上就是怎么用Python 正則表達式識別樓主,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。