如何使用Android實現XML解析技術

發布時間：2020-07-15 14:05:35 來源：億速云閱讀：205 作者：Leah 欄目：編程語言

本篇文章給大家分享的是有關如何使用Android實現XML解析技術，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

本文介紹在Android平臺中實現對XML的三種解析方式。

XML在各種開發中都廣泛應用，Android也不例外。作為承載數據的一個重要角色，如何讀寫XML成為Android開發中一項重要的技能。

在Android中，常見的XML解析器分別為DOM解析器、SAX解析器和PULL解析器，下面，我將一一向大家詳細介紹。

第一種方式：DOM解析器：

DOM是基于樹形結構的的節點或信息片段的集合，允許開發人員使用DOM API遍歷XML樹、檢索所需數據。分析該結構通常需要加載整個文檔和構造樹形結構，然后才可以檢索和更新節點信息。Android完全支持DOM 解析。利用DOM中的對象，可以對XML文檔進行讀取、搜索、修改、添加和刪除等操作。

DOM的工作原理：使用DOM對XML文件進行操作時，首先要解析文件，將文件分為獨立的元素、屬性和注釋等，然后以節點樹的形式在內存中對XML文件進行表示，就可以通過節點樹訪問文檔的內容，并根據需要修改文檔——這就是DOM的工作原理。

DOM實現時首先為XML文檔的解析定義一組接口，解析器讀入整個文檔，然后構造一個駐留內存的樹結構，這樣代碼就可以使用DOM接口來操作整個樹結構。

由于DOM在內存中以樹形結構存放，因此檢索和更新效率會更高。但是對于特別大的文檔，解析和加載整個文檔將會很耗資源。當然，如果XML文件的內容比較小，采用DOM是可行的。

常用的DoM接口和類：

Document：該接口定義分析并創建DOM文檔的一系列方法，它是文檔樹的根，是操作DOM的基礎。

Element：該接口繼承Node接口，提供了獲取、修改XML元素名字和屬性的方法。

Node：該接口提供處理并獲取節點和子節點值的方法。

NodeList：提供獲得節點個數和當前節點的方法。這樣就可以迭代地訪問各個節點。

DOMParser：該類是Apache的Xerces中的DOM解析器類，可直接解析XML文件。

下面是DOM的解析流程：

如何使用Android實現XML解析技術

第二種方式：SAX解析器：

SAX(Simple API for XML)解析器是一種基于事件的解析器，事件驅動的流式解析方式是，從文件的開始順序解析到文檔的結束，不可暫停或倒退。它的核心是事件處理模式，主要是圍繞著事件源以及事件處理器來工作的。當事件源產生事件后，調用事件處理器相應的處理方法，一個事件就可以得到處理。在事件源調用事件處理器中特定方法的時候，還要傳遞給事件處理器相應事件的狀態信息，這樣事件處理器才能夠根據提供的事件信息來決定自己的行為。

SAX解析器的優點是解析速度快，占用內存少。非常適合在Android移動設備中使用。

SAX的工作原理：SAX的工作原理簡單地說就是對文檔進行順序掃描，當掃描到文檔(document)開始與結束、元素(element)開始與結束、文檔(document)結束等地方時通知事件處理函數，由事件處理函數做相應動作，然后繼續同樣的掃描，直至文檔結束。

在SAX接口中，事件源是org.xml.sax包中的XMLReader，它通過parser()方法來解析XML文檔，并產生事件。事件處理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler，以及EntityResolver這4個接口。XMLReader通過相應事件處理器注冊方法setXXXX()來完成的與ContentHander、DTDHander、ErrorHandler，以及EntityResolver這4個接口的連接。

常用的SAX接口和類：

Attrbutes：用于得到屬性的個數、名字和值。

ContentHandler：定義與文檔本身關聯的事件(例如，開始和結束標記)。大多數應用程序都注冊這些事件。

DTDHandler：定義與DTD關聯的事件。它沒有定義足夠的事件來完整地報告DTD。如果需要對DTD進行語法分析，請使用可選的DeclHandler。

DeclHandler是SAX的擴展。不是所有的語法分析器都支持它。

EntityResolver：定義與裝入實體關聯的事件。只有少數幾個應用程序注冊這些事件。

ErrorHandler：定義錯誤事件。許多應用程序注冊這些事件以便用它們自己的方式報錯。

DefaultHandler：它提供了這些接LI的缺省實現。在大多數情況下，為應用程序擴展DefaultHandler并覆蓋相關的方法要比直接實現一個接口更容易。

詳見下表：

如何使用Android實現XML解析技術

可知，我們需要XmlReader 以及DefaultHandler來配合解析xml。

下面是SAX的解析流程：

如何使用Android實現XML解析技術

第三種方式：PULL解析器：

Android并未提供對Java StAX API的支持。但是，Android附帶了一個pull解析器，其工作方式類似于StAX。它允許用戶的應用程序代碼從解析器中獲取事件，這與SAX解析器自動將事件推入處理程序相反。

PULL解析器的運行方式和SAX類似，都是基于事件的模式。不同的是，在PULL解析過程中返回的是數字，且我們需要自己獲取產生的事件然后做相應的操作，而不像SAX那樣由處理器觸發一種事件的方法，執行我們的代碼。

下面是PULL解析XML的過程：

讀取到xml的聲明返回 START_DOCUMENT;

讀取到xml的結束返回 END_DOCUMENT ;

讀取到xml的開始標簽返回 START_TAG

讀取到xml的結束標簽返回 END_TAG

讀取到xml的文本返回 TEXT

PULL解析器小巧輕便，解析速度快，簡單易用，非常適合在Android移動設備中使用，Android系統內部在解析各種XML時也是用PULL解析器，Android官方推薦開發者們使用Pull解析技術。Pull解析技術是第三方開發的開源技術，它同樣可以應用于JavaSE開發。

PULL 的工作原理：XML pull提供了開始元素和結束元素。當某個元素開始時，我們可以調用parser．nextText從XML文檔中提取所有字符數據。當解釋到一個文檔結束時，自動生成EndDocument事件。

常用的XML pull的接口和類：

XmlPullParser：XML pull解析器是一個在XMLPULL VlAP1中提供了定義解析功能的接口。

XmlSerializer：它是一個接口，定義了XML信息集的序列。

XmlPullParserFactory：這個類用于在XMPULL V1 API中創建XML Pull解析器。

XmlPullParserException：拋出單一的XML pull解析器相關的錯誤。

PULL的解析流程如下：

如何使用Android實現XML解析技術

[附加]第四種方式： Android.util.Xml類

在Android API中，另外提供了Android．util．Xml類，同樣可以解析XML文件，使用方法類似SAX，也都需編寫Handler來處理XML的解析，但是在使用上卻比SAX來得簡單，如下所示：

以android．util．XML實現XML解析，

MyHandler myHandler=new MyHandler0；

android．util．Xm1．parse(ur1．openC0nnection()．getlnputStream0，Xm1．Encoding．UTF-8，myHandler)；

下面是一個參考文檔river.xml，放在assets目錄.如下：

<?xml version="1.0" encoding="utf-8"?> 
<rivers> <river name="靈渠" length="605">     <introduction>

靈渠在廣西壯族自治區興安縣境內，是世界上最古老的運河之一，有著“世界古代水利建筑明珠”的美譽。靈渠古稱秦鑿渠、零渠、陡河、興安運河，于公元前214年鑿成通航，距今已2217年，仍然發揮著功用。

  </
introduction
>
      
<
imageurl
>
      http://www.php.cn/
     
</
imageurl
>
   
</
river
>
 
   
   
<
river 
name
="膠萊運河"
 length
="200"
>
     
<
introduction
>

膠萊運河南起黃海靈山海口，北抵渤海三山島，流經現膠南、膠州、平度、高密、昌邑和萊州等，全長200公里，流域面積達5400平方公里，南北貫穿山東半島，溝通黃渤兩海。膠萊運河自平度姚家村東的分水嶺南北分流。南流由麻灣口入膠州灣，為南膠萊河，長30公里。北流由海倉口入萊州灣,為北膠萊河,長100余公里。

</
introduction
>
      
<
imageurl
>
      http://www.php.cn/
     
</
imageurl
>
   
</
river
>
   
   
<
river 
name
="蘇北灌溉總渠"
 length
="168"
>
 
     
<
introduction
>

位于淮河下游江蘇省北部，西起洪澤湖邊的高良澗，流經洪澤，青浦、淮安，阜寧、射陽，濱海等六縣(區)，東至扁擔港口入海的大型人工河道。全長168km。

 </
introduction
>
      
<
imageurl
>
      http://www.php.cn/
     
</
imageurl
>
   
</
river
>
 
</
rivers
>

采用DOM解析時具體處理步驟是：

1 首先利用DocumentBuilderFactory創建一個DocumentBuilderFactory實例
2 然后利用DocumentBuilderFactory創建DocumentBuilder

3 然后加載XML文檔（Document）,
4 然后獲取文檔的根結點(Element)，
5 然后獲取根結點中所有子節點的列表（NodeList），
6 然后使用再獲取子節點列表中的需要讀取的結點。

當然我們觀察節點，我需要用一個River對象來保存數據，抽象出River類

public class River implements Serializable {     
   privatestaticfinallong serialVersionUID = 1L;     
   private String name;    
   public String getName() {        
   return name;    }    
   public void setName(String name) {        
   this.name = name;    }    
   public int getLength() {        
   return length;    }    
   public void setLength(int length) {        
   this.length = length;    }    
   public String getIntroduction() {        
   return introduction;    }    
   public void setIntroduction(String introduction) {        
   this.introduction = introduction;    }    
   public String getImageurl() {        
   return imageurl;    }    
   public void setImageurl(String imageurl) {        
   this.imageurl = imageurl;    }    
   private int length;    
   private String introduction;    
   private String imageurl; }

下面我們就開始讀取xml文檔對象，并添加進List中：

代碼如下：我們這里是使用assets中的river.xml文件，那么就需要讀取這個xml文件，返回輸入流。讀取方法為：inputStream=this.context.getResources().getAssets().open(fileName); 參數是xml文件路徑，當然默認的是assets目錄為根目錄。

然后可以用DocumentBuilder對象的parse方法解析輸入流，并返回document對象，然后再遍歷doument對象的節點屬性。

//獲取全部河流數據 


   /**   
     * 參數fileName：為xml文檔路徑

     */

    public List<River> getRiversFromXml(String fileName){

        List<River> rivers=new ArrayList<River>();

        DocumentBuilderFactory factory=null;

        DocumentBuilder builder=null;

        Document document=null;

        InputStream inputStream=null;

        //首先找到xml文件

        factory=DocumentBuilderFactory.newInstance();

        try {

            //找到xml，并加載文檔

            builder=factory.newDocumentBuilder();

            inputStream=this.context.getResources().getAssets().open(fileName);

            document=builder.parse(inputStream);

            //找到根Element

             Element root=document.getDocumentElement();

             NodeList nodes=root.getElementsByTagName(RIVER);

            //遍歷根節點所有子節點,rivers 下所有river

             River river=null;

             for(int i=0;i<nodes.getLength();i++){

                     river=new River(); 

                     //獲取river元素節點

                     Element riverElement=(Element)(nodes.item(i));

                     //獲取river中name屬性值

                     river.setName(riverElement.getAttribute(NAME));

                     river.setLength(Integer.parseInt(riverElement.getAttribute(LENGTH)));

                     //獲取river下introduction標簽

                     Element introduction=(Element)riverElement.getElementsByTagName(INTRODUCTION).item(0);

                     river.setIntroduction(introduction.getFirstChild().getNodeValue());

                     Element imageUrl=(Element)riverElement.getElementsByTagName(IMAGEURL).item(0);

                     river.setImageurl(imageUrl.getFirstChild().getNodeValue()); 

                 rivers.add(river);

             }

        }catch (IOException e){

            e.printStackTrace();

        } catch (SAXException e) {

            e.printStackTrace();

        }

         catch (ParserConfigurationException e) {

            e.printStackTrace();

        }finally{

            try {

                inputStream.close();

            } catch (IOException e) {    

                e.printStackTrace();

            }

        }

        return rivers;

    }

在這里添加到List中，然后我們使用ListView將他們顯示出來。如圖所示：

如何使用Android實現XML解析技術

采用SAX解析時具體處理步驟是：

1 創建SAXParserFactory對象

2 根據SAXParserFactory.newSAXParser()方法返回一個SAXParser解析器

3 根據SAXParser解析器獲取事件源對象XMLReader

4 實例化一個DefaultHandler對象

5 連接事件源對象XMLReader到事件處理類DefaultHandler中

6 調用XMLReader的parse方法從輸入源中獲取到的xml數據

7 通過DefaultHandler返回我們需要的數據集合。

代碼如下：

public List<River> parse(String xmlPath){
	List<River> rivers=null;

        SAXParserFactory factory=SAXParserFactory.newInstance();

        try {

            SAXParser parser=factory.newSAXParser();

            //獲取事件源

            XMLReader xmlReader=parser.getXMLReader();

            //設置處理器

            RiverHandler handler=new RiverHandler();

            xmlReader.setContentHandler(handler);

            //解析xml文檔

            //xmlReader.parse(new InputSource(new URL(xmlPath).openStream()));

            xmlReader.parse(new InputSource(this.context.getAssets().open(xmlPath)));

            rivers=handler.getRivers();    

        } catch (ParserConfigurationException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        } catch (SAXException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        } catch (IOException e) {

            e.printStackTrace();

        }

        

        return rivers;

    }

重點在于DefaultHandler對象中對每一個元素節點，屬性，文本內容，文檔內容進行處理。

前面說過DefaultHandler是基于事件處理模型的，基本處理方式是：當SAX解析器導航到文檔開始標簽時回調startDocument方法，導航到文檔結束標簽時回調endDocument方法。當SAX解析器導航到元素開始標簽時回調startElement方法，導航到其文本內容時回調characters方法，導航到標簽結束時回調endElement方法。

根據以上的解釋，我們可以得出以下處理xml文檔邏輯：

1：當導航到文檔開始標簽時，在回調函數startDocument中，可以不做處理，當然你可以驗證下UTF-8等等。

2：當導航到rivers開始標簽時，在回調方法startElement中可以實例化一個集合用來存貯list，不過我們這里不用，因為在構造函數中已經實例化了。

3：導航到river開始標簽時，就說明需要實例化River對象了，當然river標簽中還有name ,length屬性，因此實例化River后還必須取出屬性值，attributes.getValue(NAME)，同時賦予river對象中，同時添加為導航到的river標簽添加一個boolean為真的標識，用來說明導航到了river元素。

4:當然有river標簽內還有子標簽（節點），但是SAX解析器是不知道導航到什么標簽的，它只懂得開始，結束而已。那么如何讓它認得我們的各個標簽呢？當然需要判斷了，于是可以使用回調方法startElement中的參數String localName，把我們的標簽字符串與這個參數比較下，就可以了。我們還必須讓SAX知道，現在導航到的是某個標簽，因此添加一個true屬性讓SAX解析器知道。

5：它還會導航到文本內標簽，（就是<img></img>里面的內容），回調方法characters，我們一般在這個方法中取出就是<img></img>里面的內容，并保存。 6：當然它是一定會導航到結束標簽</river> 或者</rivers>的，如果是</river>標簽，記得把river對象添加進list中。如果是river中的子標簽</introduction>，就把前面設置標記導航到這個標簽的boolean標記設置為false. 按照以上實現思路，可以實現如下代碼：

/**導航到開始標簽觸發**/
        publicvoid startElement (String uri, String localName, String qName, Attributes attributes){ 
         String tagName=localName.length()!=0?localName:qName;
         tagName=tagName.toLowerCase().trim();
         //如果讀取的是river標簽開始，則實例化River
         if(tagName.equals(RIVER)){
             isRiver=true;
             river=new River();
                /**導航到river開始節點后**/
                river.setName(attributes.getValue(NAME));
                river.setLength(Integer.parseInt(attributes.getValue(LENGTH)));
         }
         //然后讀取其他節點
          if(isRiver){ 
              if(tagName.equals(INTRODUCTION)){
                 xintroduction=true;
             }else if(tagName.equals(IMAGEURL)){
                 ximageurl=true;
             }  
         }  
        }
        
        /**導航到結束標簽觸發**/
        public void endElement (String uri, String localName, String qName){
         String tagName=localName.length()!=0?localName:qName;
         tagName=tagName.toLowerCase().trim();
         
        //如果讀取的是river標簽結束，則把River添加進集合中
         if(tagName.equals(RIVER)){
             isRiver=true;
             rivers.add(river);
         }
         //然后讀取其他節點
          if(isRiver){ 
              if(tagName.equals(INTRODUCTION)){
                 xintroduction=false;
             }else if(tagName.equals(IMAGEURL)){
                 ximageurl=false;
             } 
          }   
        } 
        
        //這里是讀取到節點內容時候回調
        public void characters (char[] ch, int start, int length){
            //設置屬性值
                if(xintroduction){
                     //解決null問題
                     river.setIntroduction(river.getIntroduction()==null?"":river.getIntroduction()+new String(ch,start,length));
                 }else if(ximageurl){
                     //解決null問題
                     river.setImageurl(river.getImageurl()==null?"":river.getImageurl()+new String(ch,start,length));
                 }    
        }

運行效果跟上例DOM 運行效果相同。

采用PULL解析基本處理方式：

當PULL解析器導航到文檔開始標簽時就開始實例化list集合用來存貯數據對象。導航到元素開始標簽時回判斷元素標簽類型，如果是river標簽，則需要實例化River對象了，如果是其他類型，則取得該標簽內容并賦予River對象。當然它也會導航到文本標簽，不過在這里，我們可以不用。

根據以上的解釋，我們可以得出以下處理xml文檔邏輯：

1：當導航到XmlPullParser.START_DOCUMENT，可以不做處理，當然你可以實例化集合對象等等。

2：當導航到XmlPullParser.START_TAG，則判斷是否是river標簽，如果是，則實例化river對象，并調用getAttributeValue方法獲取標簽中屬性值。

3：當導航到其他標簽，比如Introduction時候，則判斷river對象是否為空，如不為空，則取出Introduction中的內容，nextText方法來獲取文本節點內容

4：當然啦，它一定會導航到XmlPullParser.END_TAG的，有開始就要有結束嘛。在這里我們就需要判讀是否是river結束標簽，如果是，則把river對象存進list集合中了，并設置river對象為null.

由以上的處理邏輯，我們可以得出以下代碼：

  public List<River> parse(String xmlPath){
	List<River> rivers=new ArrayList<River>();
        River river=null;
        InputStream inputStream=null;    
        //獲得XmlPullParser解析器
        XmlPullParser xmlParser = Xml.newPullParser();   
        try {
            //得到文件流，并設置編碼方式
            inputStream=this.context.getResources().getAssets().open(xmlPath);
            xmlParser.setInput(inputStream, "utf-8");
            //獲得解析到的事件類別，這里有開始文檔，結束文檔，開始標簽，結束標簽，文本等等事件。
            int evtType=xmlParser.getEventType();
         //一直循環，直到文檔結束    
         while(evtType!=XmlPullParser.END_DOCUMENT){ 
            switch(evtType){ 
            case XmlPullParser.START_TAG:
                String tag = xmlParser.getName(); 
                //如果是river標簽開始，則說明需要實例化對象了
                if (tag.equalsIgnoreCase(RIVER)) { 
                   river = new River(); 
                  //取出river標簽中的一些屬性值
                  river.setName(xmlParser.getAttributeValue(null, NAME));
                  river.setLength(Integer.parseInt(xmlParser.getAttributeValue(null, LENGTH)));
                }else if(river!=null){
                    //如果遇到introduction標簽，則讀取它內容
                    if(tag.equalsIgnoreCase(INTRODUCTION)){
                    river.setIntroduction(xmlParser.nextText());
                    }else if(tag.equalsIgnoreCase(IMAGEURL)){
                        river.setImageurl(xmlParser.nextText());
                    }
                }
                break;
                
           case XmlPullParser.END_TAG:
             //如果遇到river標簽結束，則把river對象添加進集合中
               if (xmlParser.getName().equalsIgnoreCase(RIVER) && river != null) { 
                   rivers.add(river); 
                   river = null; 
               }
                break; 
                default:break;
            }
            //如果xml沒有結束，則導航到下一個river節點
            evtType=xmlParser.next();
         }
        } catch (XmlPullParserException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }catch (IOException e1) {
            // TODO Auto-generated catch block
            e1.printStackTrace();
        } 
        return rivers; 
 }

運行效果和上面的一樣。

幾種解析技術的比較與總結：

對于Android的移動設備而言，因為設備的資源比較寶貴，內存是有限的，所以我們需要選擇適合的技術來解析XML，這樣有利于提高訪問的速度。

1 DOM在處理XML文件時，將XML文件解析成樹狀結構并放入內存中進行處理。當XML文件較小時，我們可以選DOM，因為它簡單、直觀。

2 SAX則是以事件作為解析XML文件的模式，它將XML文件轉化成一系列的事件，由不同的事件處理器來決定如何處理。XML文件較大時，選擇SAX技術是比較合理的。雖然代碼量有些大，但是它不需要將所有的XML文件加載到內存中。這樣對于有限的Android內存更有效，而且Android提供了一種傳統的SAX使用方法以及一個便捷的SAX包裝器。使用Android．util．Xml類，從示例中可以看出，會比使用 SAX來得簡單。

3 XML pull解析并未像SAX解析那樣監聽元素的結束，而是在開始處完成了大部分處理。這有利于提早讀取XML文件，可以極大的減少解析時間，這種優化對于連接速度較漫的移動設備而言尤為重要。對于XML文檔較大但只需要文檔的一部分時，XML Pull解析器則是更為有效的方法。

以上就是如何使用Android實現XML解析技術，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

如何使用Android實現XML解析技術

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

如何使用Android實現XML解析技術

猜你喜歡

最新資訊

相關推薦

相關標簽