您好,登錄后才能下訂單哦!
如何解析初學Python時的注意事項,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
初學Python時需要注意相關事項,首先初學Python時要先知道什么是Python?那么下面說一下什么是Python,所謂Python:是一種面向對象、直譯式計算機程序設計語言,也是一種功能強大而完善的通用型語言。
我們目前要把一個表態HTML頁面轉換成PORTAL。由于表態頁面數量很大,所以我們采用動態改寫的方法。由于這篇的目的不是介紹我們的項目。所以直接說我的腳本。由于我們的工作,我們現在做操作前要對所以的靜態頁面進行簡單的標記分析。這里主要分析TABLE,TR和TD。
下面貼下我的代碼:初學Python主要是兩個文件:
import os, fnmatch # judge comment tag to delete comment statement def judgeComment (line): openTag = line.find('<!--') closeTag = line.find('-->') if openTag != -1: if closeTag != -1:# <!-- --> return 1 else:#<!-- return 2 elif closeTag != -1:#--> return 3 else:# return 4 # sort for a 2 dimension list(array) def sortFor2di (listtosort): size = len(listtosort) for i in range(size-1): for j in range(i + 1,size): list1 = listtosort[i] list2 = listtosort[j] if list1[0] > list2[0]: listtosort[i],listtosort[j] = listtosort[j],listtosort[i] # get all tags in a line in the form of list def getLineTagList (line): taglist = [] addTag2List (line,'table',taglist) addTag2List (line,'tr',taglist) addTag2List (line,'td',taglist) sortFor2di (taglist) return taglist def addTag2List (line,tag,taglist): pos = line.find('<'+tag) if pos != -1: taglist.append([pos,'<'+ tag + '>']) pos = line.find('</'+tag+'>') if pos != -1: taglist.append([pos,'</' + tag + '>']) def addDelTag(itemlist,stackList): tag = itemlist[1] res = 0 res += judgeWhichTag (tag,'table',stackList) res += judgeWhichTag (tag,'tr',stackList) res += judgeWhichTag (tag,'td',stackList) if res != 0: return -1 else: return 1 # def judgeWhichTag (tag,lable,stackList): if tag == '<' + lable + '>': stackList.append(lable) return 0 elif tag == '</' + lable + '>': size = len(stackList) if size < 1: return -1 elif stackList[size - 1] == lable: del(stackList[size -1 ]) return 0 else: return -1 else: return 0 # used to deal tag def tagDeal (tag, line,stackList): openTag = line.find('<'+tag) closeTag = line.find('</'+tag+'>') if openTag != -1: stackList.append (tag) if closeTag == -1: return 1 if closeTag != -1: size = len(stackList) if size < 1: return -1 else: lastItem = stackList[size - 1] if lastItem != tag: return -1 else: del (stackList[size - 1]) return 1 def find (pattern,startdir=os.curdir): files = [] os.path.walk(startdir,visitor,(pattern,files)) files.sort() return files def visitor ((pattern,files),thisdir,names): for name in names: if fnmatch.fnmatch(name,pattern): fullpath = os.path.join(thisdir,name) files.append(fullpath)
申明一下,我是初學Python。上面的程序寫得很亂,以后有時間再修改或加點注釋。當然很歡迎各位朋友給點意見。不過,***的結果是我們的總共1000表態頁面中共有200個頁面這三種標簽有錯誤。這就意味著有一大堆事情要處理。至于怎么做我們還沒做好決定。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。