您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關如何使用Android實現XML解析技術,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
本文介紹在Android平臺中實現對XML的三種解析方式。
XML在各種開發中都廣泛應用,Android也不例外。作為承載數據的一個重要角色,如何讀寫XML成為Android開發中一項重要的技能。
在Android中,常見的XML解析器分別為DOM解析器、SAX解析器和PULL解析器,下面,我將一一向大家詳細介紹。
第一種方式:DOM解析器:
DOM是基于樹形結構的的節點或信息片段的集合,允許開發人員使用DOM API遍歷XML樹、檢索所需數據。分析該結構通常需要加載整個文檔和構造樹形結構,然后才可以檢索和更新節點信息。Android完全支持DOM 解析。利用DOM中的對象,可以對XML文檔進行讀取、搜索、修改、添加和刪除等操作。
DOM的工作原理:使用DOM對XML文件進行操作時,首先要解析文件,將文件分為獨立的元素、屬性和注釋等,然后以節點樹的形式在內存中對XML文件進行表示,就可以通過節點樹訪問文檔的內容,并根據需要修改文檔——這就是DOM的工作原理。
DOM實現時首先為XML文檔的解析定義一組接口,解析器讀入整個文檔,然后構造一個駐留內存的樹結構,這樣代碼就可以使用DOM接口來操作整個樹結構。
由于DOM在內存中以樹形結構存放,因此檢索和更新效率會更高。但是對于特別大的文檔,解析和加載整個文檔將會很耗資源。 當然,如果XML文件的內容比較小,采用DOM是可行的。
常用的DoM接口和類:
Document:該接口定義分析并創建DOM文檔的一系列方法,它是文檔樹的根,是操作DOM的基礎。
Element:該接口繼承Node接口,提供了獲取、修改XML元素名字和屬性的方法。
Node:該接口提供處理并獲取節點和子節點值的方法。
NodeList:提供獲得節點個數和當前節點的方法。這樣就可以迭代地訪問各個節點。
DOMParser:該類是Apache的Xerces中的DOM解析器類,可直接解析XML文件。
下面是DOM的解析流程:
第二種方式:SAX解析器:
SAX(Simple API for XML)解析器是一種基于事件的解析器,事件驅動的流式解析方式是,從文件的開始順序解析到文檔的結束,不可暫停或倒退。它的核心是事件處理模式,主要是圍繞著事件源以及事件處理器來工作的。當事件源產生事件后,調用事件處理器相應的處理方法,一個事件就可以得到處理。在事件源調用事件處理器中特定方法的時候,還要傳遞給事件處理器相應事件的狀態信息,這樣事件處理器才能夠根據提供的事件信息來決定自己的行為。
SAX解析器的優點是解析速度快,占用內存少。非常適合在Android移動設備中使用。
SAX的工作原理:SAX的工作原理簡單地說就是對文檔進行順序掃描,當掃描到文檔(document)開始與結束、元素(element)開始與結束、文檔(document)結束等地方時通知事件處理函數,由事件處理函數做相應動作,然后繼續同樣的掃描,直至文檔結束。
在SAX接口中,事件源是org.xml.sax包中的XMLReader,它通過parser()方法來解析XML文檔,并產生事件。事件處理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個接口。XMLReader通過相應事件處理器注冊方法setXXXX()來完成的與ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個接口的連接。
常用的SAX接口和類:
Attrbutes:用于得到屬性的個數、名字和值。
ContentHandler:定義與文檔本身關聯的事件(例如,開始和結束標記)。大多數應用程序都注冊這些事件。
DTDHandler:定義與DTD關聯的事件。它沒有定義足夠的事件來完整地報告DTD。如果需要對DTD進行語法分析,請使用可選的DeclHandler。
DeclHandler是SAX的擴展。不是所有的語法分析器都支持它。
EntityResolver:定義與裝入實體關聯的事件。只有少數幾個應用程序注冊這些事件。
ErrorHandler:定義錯誤事件。許多應用程序注冊這些事件以便用它們自己的方式報錯。
DefaultHandler:它提供了這些接LI的缺省實現。在大多數情況下,為應用程序擴展DefaultHandler并覆蓋相關的方法要比直接實現一個接口更容易。
詳見下表:
可知,我們需要XmlReader 以及DefaultHandler來配合解析xml。
下面是SAX的解析流程:
第三種方式:PULL解析器:
Android并未提供對Java StAX API的支持。但是,Android附帶了一個pull解析器,其工作方式類似于StAX。它允許用戶的應用程序代碼從解析器中獲取事件,這與SAX解析器自動將事件推入處理程序相反。
PULL解析器的運行方式和SAX類似,都是基于事件的模式。不同的是,在PULL解析過程中返回的是數字,且我們需要自己獲取產生的事件然后做相應的操作,而不像SAX那樣由處理器觸發一種事件的方法,執行我們的代碼。
下面是PULL解析XML的過程:
讀取到xml的聲明返回 START_DOCUMENT;
讀取到xml的結束返回 END_DOCUMENT ;
讀取到xml的開始標簽返回 START_TAG
讀取到xml的結束標簽返回 END_TAG
讀取到xml的文本返回 TEXT
PULL解析器小巧輕便,解析速度快,簡單易用,非常適合在Android移動設備中使用,Android系統內部在解析各種XML時也是用PULL解析器,Android官方推薦開發者們使用Pull解析技術。Pull解析技術是第三方開發的開源技術,它同樣可以應用于JavaSE開發。
PULL 的工作原理:XML pull提供了開始元素和結束元素。當某個元素開始時,我們可以調用parser.nextText從XML文檔中提取所有字符數據。當解釋到一個文檔結束時,自動生成EndDocument事件。
常用的XML pull的接口和類:
XmlPullParser:XML pull解析器是一個在XMLPULL VlAP1中提供了定義解析功能的接口。
XmlSerializer:它是一個接口,定義了XML信息集的序列。
XmlPullParserFactory:這個類用于在XMPULL V1 API中創建XML Pull解析器。
XmlPullParserException:拋出單一的XML pull解析器相關的錯誤。
PULL的解析流程如下:
[附加]第四種方式: Android.util.Xml類
在Android API中,另外提供了Android.util.Xml類,同樣可以解析XML文件,使用方法類似SAX,也都需編寫Handler來處理XML的解析,但是在使用上卻比SAX來得簡單 ,如下所示:
以android.util.XML實現XML解析 ,
MyHandler myHandler=new MyHandler0;
android.util.Xm1.parse(ur1.openC0nnection().getlnputStream0,Xm1.Encoding.UTF-8,myHandler);
下面是一個參考文檔river.xml,放在assets目錄.如下:
<?xml version="1.0" encoding="utf-8"?> <rivers> <river name="靈渠" length="605"> <introduction>
靈渠在廣西壯族自治區興安縣境內,是世界上最古老的運河之一,有著“世界古代水利建筑明珠”的美譽。靈渠古稱秦鑿渠、零渠、陡河、興安運河,于公元前214年鑿成通航,距今已2217年,仍然發揮著功用。
</ introduction > < imageurl > http://www.php.cn/ </ imageurl > </ river > < river name ="膠萊運河" length ="200" > < introduction >
膠萊運河南起黃海靈山海口,北抵渤海三山島,流經現膠南、膠州、平度、高密、昌邑和萊州等,全長200公里,流域面積達5400平方公里,南北貫穿山東半島,溝通黃渤兩海。膠萊運河自平度姚家村東的分水嶺南北分流。南流由麻灣口入膠州灣,為南膠萊河,長30公里。北流由海倉口入萊州灣,為北膠萊河,長100余公里。
</ introduction > < imageurl > http://www.php.cn/ </ imageurl > </ river > < river name ="蘇北灌溉總渠" length ="168" > < introduction >
位于淮河下游江蘇省北部,西起洪澤湖邊的高良澗,流經洪澤,青浦、淮安,阜寧、射陽,濱海等六縣(區),東至扁擔港口入海的大型人工河道。全長168km。
</ introduction > < imageurl > http://www.php.cn/ </ imageurl > </ river > </ rivers >
采用DOM解析時具體處理步驟是:
1 首先利用DocumentBuilderFactory創建一個DocumentBuilderFactory實例
2 然后利用DocumentBuilderFactory創建DocumentBuilder
3 然后加載XML文檔(Document),
4 然后獲取文檔的根結點(Element),
5 然后獲取根結點中所有子節點的列表(NodeList),
6 然后使用再獲取子節點列表中的需要讀取的結點。
當然我們觀察節點,我需要用一個River對象來保存數據,抽象出River類
public class River implements Serializable { privatestaticfinallong serialVersionUID = 1L; private String name; public String getName() { return name; } public void setName(String name) { this.name = name; } public int getLength() { return length; } public void setLength(int length) { this.length = length; } public String getIntroduction() { return introduction; } public void setIntroduction(String introduction) { this.introduction = introduction; } public String getImageurl() { return imageurl; } public void setImageurl(String imageurl) { this.imageurl = imageurl; } private int length; private String introduction; private String imageurl; }
下面我們就開始讀取xml文檔對象,并添加進List中:
代碼如下: 我們這里是使用assets中的river.xml文件,那么就需要讀取這個xml文件,返回輸入流。 讀取方法為:inputStream=this.context.getResources().getAssets().open(fileName); 參數是xml文件路徑,當然默認的是assets目錄為根目錄。
然后可以用DocumentBuilder對象的parse方法解析輸入流,并返回document對象,然后再遍歷doument對象的節點屬性。
//獲取全部河流數據 /** * 參數fileName:為xml文檔路徑 */ public List<River> getRiversFromXml(String fileName){ List<River> rivers=new ArrayList<River>(); DocumentBuilderFactory factory=null; DocumentBuilder builder=null; Document document=null; InputStream inputStream=null; //首先找到xml文件 factory=DocumentBuilderFactory.newInstance(); try { //找到xml,并加載文檔 builder=factory.newDocumentBuilder(); inputStream=this.context.getResources().getAssets().open(fileName); document=builder.parse(inputStream); //找到根Element Element root=document.getDocumentElement(); NodeList nodes=root.getElementsByTagName(RIVER); //遍歷根節點所有子節點,rivers 下所有river River river=null; for(int i=0;i<nodes.getLength();i++){ river=new River(); //獲取river元素節點 Element riverElement=(Element)(nodes.item(i)); //獲取river中name屬性值 river.setName(riverElement.getAttribute(NAME)); river.setLength(Integer.parseInt(riverElement.getAttribute(LENGTH))); //獲取river下introduction標簽 Element introduction=(Element)riverElement.getElementsByTagName(INTRODUCTION).item(0); river.setIntroduction(introduction.getFirstChild().getNodeValue()); Element imageUrl=(Element)riverElement.getElementsByTagName(IMAGEURL).item(0); river.setImageurl(imageUrl.getFirstChild().getNodeValue()); rivers.add(river); } }catch (IOException e){ e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (ParserConfigurationException e) { e.printStackTrace(); }finally{ try { inputStream.close(); } catch (IOException e) { e.printStackTrace(); } } return rivers; }
在這里添加到List中, 然后我們使用ListView將他們顯示出來。如圖所示:
采用SAX解析時具體處理步驟是:
1 創建SAXParserFactory對象
2 根據SAXParserFactory.newSAXParser()方法返回一個SAXParser解析器
3 根據SAXParser解析器獲取事件源對象XMLReader
4 實例化一個DefaultHandler對象
5 連接事件源對象XMLReader到事件處理類DefaultHandler中
6 調用XMLReader的parse方法從輸入源中獲取到的xml數據
7 通過DefaultHandler返回我們需要的數據集合。
代碼如下:
public List<River> parse(String xmlPath){ List<River> rivers=null; SAXParserFactory factory=SAXParserFactory.newInstance(); try { SAXParser parser=factory.newSAXParser(); //獲取事件源 XMLReader xmlReader=parser.getXMLReader(); //設置處理器 RiverHandler handler=new RiverHandler(); xmlReader.setContentHandler(handler); //解析xml文檔 //xmlReader.parse(new InputSource(new URL(xmlPath).openStream())); xmlReader.parse(new InputSource(this.context.getAssets().open(xmlPath))); rivers=handler.getRivers(); } catch (ParserConfigurationException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (SAXException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return rivers; }
重點在于DefaultHandler對象中對每一個元素節點,屬性,文本內容,文檔內容進行處理。
前面說過DefaultHandler是基于事件處理模型的,基本處理方式是:當SAX解析器導航到文檔開始標簽時回調startDocument方法,導航到文檔結束標簽時回調endDocument方法。當SAX解析器導航到元素開始標簽時回調startElement方法,導航到其文本內容時回調characters方法,導航到標簽結束時回調endElement方法。
根據以上的解釋,我們可以得出以下處理xml文檔邏輯:
1:當導航到文檔開始標簽時,在回調函數startDocument中,可以不做處理,當然你可以驗證下UTF-8等等。
2:當導航到rivers開始標簽時,在回調方法startElement中可以實例化一個集合用來存貯list,不過我們這里不用,因為在構造函數中已經實例化了。
3:導航到river開始標簽時,就說明需要實例化River對象了,當然river標簽中還有name ,length屬性,因此實例化River后還必須取出屬性值,attributes.getValue(NAME),同時賦予river對象中,同時添加為導航到的river標簽添加一個boolean為真的標識,用來說明導航到了river元素。
4:當然有river標簽內還有子標簽(節點),但是SAX解析器是不知道導航到什么標簽的,它只懂得開始,結束而已。那么如何讓它認得我們的各個標簽呢?當然需要判斷了,于是可以使用回調方法startElement中的參數String localName,把我們的標簽字符串與這個參數比較下,就可以了。我們還必須讓SAX知道,現在導航到的是某個標簽,因此添加一個true屬性讓SAX解析器知道。
5:它還會導航到文本內標簽,(就是<img></img>里面的內容),回調方法characters,我們一般在這個方法中取出就是<img></img>里面的內容,并保存。 6:當然它是一定會導航到結束標簽</river> 或者</rivers>的,如果是</river>標簽,記得把river對象添加進list中。如果是river中的子標簽</introduction>,就把前面設置標記導航到這個標簽的boolean標記設置為false. 按照以上實現思路,可以實現如下代碼:
/**導航到開始標簽觸發**/ publicvoid startElement (String uri, String localName, String qName, Attributes attributes){ String tagName=localName.length()!=0?localName:qName; tagName=tagName.toLowerCase().trim(); //如果讀取的是river標簽開始,則實例化River if(tagName.equals(RIVER)){ isRiver=true; river=new River(); /**導航到river開始節點后**/ river.setName(attributes.getValue(NAME)); river.setLength(Integer.parseInt(attributes.getValue(LENGTH))); } //然后讀取其他節點 if(isRiver){ if(tagName.equals(INTRODUCTION)){ xintroduction=true; }else if(tagName.equals(IMAGEURL)){ ximageurl=true; } } } /**導航到結束標簽觸發**/ public void endElement (String uri, String localName, String qName){ String tagName=localName.length()!=0?localName:qName; tagName=tagName.toLowerCase().trim(); //如果讀取的是river標簽結束,則把River添加進集合中 if(tagName.equals(RIVER)){ isRiver=true; rivers.add(river); } //然后讀取其他節點 if(isRiver){ if(tagName.equals(INTRODUCTION)){ xintroduction=false; }else if(tagName.equals(IMAGEURL)){ ximageurl=false; } } } //這里是讀取到節點內容時候回調 public void characters (char[] ch, int start, int length){ //設置屬性值 if(xintroduction){ //解決null問題 river.setIntroduction(river.getIntroduction()==null?"":river.getIntroduction()+new String(ch,start,length)); }else if(ximageurl){ //解決null問題 river.setImageurl(river.getImageurl()==null?"":river.getImageurl()+new String(ch,start,length)); } }
運行效果跟上例DOM 運行效果相同。
采用PULL解析基本處理方式:
當PULL解析器導航到文檔開始標簽時就開始實例化list集合用來存貯數據對象。導航到元素開始標簽時回判斷元素標簽類型,如果是river標簽,則需要實例化River對象了,如果是其他類型,則取得該標簽內容并賦予River對象。當然它也會導航到文本標簽,不過在這里,我們可以不用。
根據以上的解釋,我們可以得出以下處理xml文檔邏輯:
1:當導航到XmlPullParser.START_DOCUMENT,可以不做處理,當然你可以實例化集合對象等等。
2:當導航到XmlPullParser.START_TAG,則判斷是否是river標簽,如果是,則實例化river對象,并調用getAttributeValue方法獲取標簽中屬性值。
3:當導航到其他標簽,比如Introduction時候,則判斷river對象是否為空,如不為空,則取出Introduction中的內容,nextText方法來獲取文本節點內容
4:當然啦,它一定會導航到XmlPullParser.END_TAG的,有開始就要有結束嘛。在這里我們就需要判讀是否是river結束標簽,如果是,則把river對象存進list集合中了,并設置river對象為null.
由以上的處理邏輯,我們可以得出以下代碼:
public List<River> parse(String xmlPath){ List<River> rivers=new ArrayList<River>(); River river=null; InputStream inputStream=null; //獲得XmlPullParser解析器 XmlPullParser xmlParser = Xml.newPullParser(); try { //得到文件流,并設置編碼方式 inputStream=this.context.getResources().getAssets().open(xmlPath); xmlParser.setInput(inputStream, "utf-8"); //獲得解析到的事件類別,這里有開始文檔,結束文檔,開始標簽,結束標簽,文本等等事件。 int evtType=xmlParser.getEventType(); //一直循環,直到文檔結束 while(evtType!=XmlPullParser.END_DOCUMENT){ switch(evtType){ case XmlPullParser.START_TAG: String tag = xmlParser.getName(); //如果是river標簽開始,則說明需要實例化對象了 if (tag.equalsIgnoreCase(RIVER)) { river = new River(); //取出river標簽中的一些屬性值 river.setName(xmlParser.getAttributeValue(null, NAME)); river.setLength(Integer.parseInt(xmlParser.getAttributeValue(null, LENGTH))); }else if(river!=null){ //如果遇到introduction標簽,則讀取它內容 if(tag.equalsIgnoreCase(INTRODUCTION)){ river.setIntroduction(xmlParser.nextText()); }else if(tag.equalsIgnoreCase(IMAGEURL)){ river.setImageurl(xmlParser.nextText()); } } break; case XmlPullParser.END_TAG: //如果遇到river標簽結束,則把river對象添加進集合中 if (xmlParser.getName().equalsIgnoreCase(RIVER) && river != null) { rivers.add(river); river = null; } break; default:break; } //如果xml沒有結束,則導航到下一個river節點 evtType=xmlParser.next(); } } catch (XmlPullParserException e) { // TODO Auto-generated catch block e.printStackTrace(); }catch (IOException e1) { // TODO Auto-generated catch block e1.printStackTrace(); } return rivers; }
運行效果和上面的一樣。
幾種解析技術的比較與總結:
對于Android的移動設備而言,因為設備的資源比較寶貴,內存是有限的,所以我們需要選擇適合的技術來解析XML,這樣有利于提高訪問的速度。
1 DOM在處理XML文件時,將XML文件解析成樹狀結構并放入內存中進行處理。當XML文件較小時,我們可以選DOM,因為它簡單、直觀。
2 SAX則是以事件作為解析XML文件的模式,它將XML文件轉化成一系列的事件,由不同的事件處理器來決定如何處理。XML文件較大時,選擇SAX技術是比較合理的。雖然代碼量有些大,但是它不需要將所有的XML文件加載到內存中。這樣對于有限的Android內存更有效,而且Android提供了一種傳統的SAX使用方法以及一個便捷的SAX包裝器。 使用Android.util.Xml類,從示例中可以看出,會比使用 SAX來得簡單。
3 XML pull解析并未像SAX解析那樣監聽元素的結束,而是在開始處完成了大部分處理。這有利于提早讀取XML文件,可以極大的減少解析時間,這種優化對于連接速度較漫的移動設備而言尤為重要。對于XML文檔較大但只需要文檔的一部分時,XML Pull解析器則是更為有效的方法。
以上就是如何使用Android實現XML解析技術,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。