萬盛學電腦網

 萬盛學電腦網 >> 網絡編程 >> 安卓開發 >> Android開發之xml解析技術

Android開發之xml解析技術

 在Android中,常見的XML解析器分別為DOM解析器、SAX解析器和PULL解析器,下面,我將一一向大家詳細介紹。
 
第一種方式:DOM解析器:
DOM是基於樹形結構的的節點或信息片段的集合,允許開發人員使用DOM API遍歷XML樹、檢索所需數據。分析該結構通常需要加載整個文檔和構造樹形結構,然後才可以檢索和更新節點信息。Android完全支持DOM 解析。利用DOM中的對象,可以對XML文檔進行讀取、搜索、修改、添加和刪除等操作。
DOM的工作原理:使用DOM對XML文件進行操作時,首先要解析文件,將文件分為獨立的元素、屬性和注釋等,然後以節點樹的形式在內存中對XML文件進行表示,就可以通過節點樹訪問文檔的內容,並根據需要修改文檔——這就是DOM的工作原理。
DOM實現時首先為XML文檔的解析定義一組接口,解析器讀入整個文檔,然後構造一個駐留內存的樹結構,這樣代碼就可以使用DOM接口來操作整個樹結構。
由於DOM在內存中以樹形結構存放,因此檢索和更新效率會更高。但是對於特別大的文檔,解析和加載整個文檔將會很耗資源。 當然,如果XML文件的內容比較小,采用DOM是可行的。
常用的DoM接口和類:
  Document:該接口定義分析並創建DOM文檔的一系列方法,它是文檔樹的根,是操作DOM的基礎。 
Element:該接口繼承Node接口,提供了獲取、修改XML元素名字和屬性的方法。
Node:該接口提供處理並獲取節點和子節點值的方法。
NodeList:提供獲得節點個數和當前節點的方法。這樣就可以迭代地訪問各個節點。
DOMParser:該類是Apache的Xerces中的DOM解析器類,可直接解析XML文件。
下面是DOM的解析流程:
 
 
第二種方式:SAX解析器:
  SAX(Simple API for XML)解析器是一種基於事件的解析器,事件驅動的流式解析方式是,從文件的開始順序解析到文檔的結束,不可暫停或倒退。它的核心是事件處理模式,主要是圍繞著事件源以及事件處理器來工作的。當事件源產生事件後,調用事件處理器相應的處理方法,一個事件就可以得到處理。在事件源調用事件處理器中特定方法的時候,還要傳遞給事件處理器相應事件的狀態信息,這樣事件處理器才能夠根據提供的事件信息來決定自己的行為。 
  SAX解析器的優點是解析速度快,占用內存少。非常適合在Android移動設備中使用。
SAX的工作原理:SAX的工作原理簡單地說就是對文檔進行順序掃描,當掃描到文檔(document)開始與結束、元素(element)開始與結束、文檔(document)結束等地方時通知事件處理函數,由事件處理函數做相應動作,然後繼續同樣的掃描,直至文檔結束。
  在SAX接口中,事件源是org.xml.sax包中的XMLReader,它通過parser()方法來解析XML文檔,並產生事件。事件處理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個接口。XMLReader通過相應事件處理器注冊方法setXXXX()來完成的與ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個接口的連接。
常用的SAX接口和類:
Attrbutes:用於得到屬性的個數、名字和值。 
ContentHandler:定義與文檔本身關聯的事件(例如,開始和結束標記)。大多數應用程序都注冊這些事件。
DTDHandler:定義與DTD關聯的事件。它沒有定義足夠的事件來完整地報告DTD。如果需要對DTD進行語法分析,請使用可選的DeclHandler。
DeclHandler是SAX的擴展。不是所有的語法分析器都支持它。
EntityResolver:定義與裝入實體關聯的事件。只有少數幾個應用程序注冊這些事件。
ErrorHandler:定義錯誤事件。許多應用程序注冊這些事件以便用它們自己的方式報錯。
DefaultHandler:它提供了這些接LI的缺省實現。在大多數情況下,為應用程序擴展DefaultHandler並覆蓋相關的方法要比直接實現一個接口更容易。
 詳見下表:
 
 
 可知,我們需要XmlReader 以及DefaultHandler來配合解析xml。
下面是SAX的解析流程:
 
 
 
第三種方式:PULL解析器:
      Android並未提供對Java StAX API的支持。但是,Android附帶了一個pull解析器,其工作方式類似於StAX。它允許用戶的應用程序代碼從解析器中獲取事件,這與SAX解析器自動將事件推入處理程序相反。
PULL解析器的運行方式和SAX類似,都是基於事件的模式。不同的是,在PULL解析過程中返回的是數字,且我們需要自己獲取產生的事件然後做相應的操作,而不像SAX那樣由處理器觸發一種事件的方法,執行我們的代碼。
        讀取到xml的聲明返回 START_DOCUMENT;
 代碼如下 復制代碼
讀取到xml的結束返回 END_DOCUMENT ;
讀取到xml的開始標簽返回 START_TAG
讀取到xml的結束標簽返回 END_TAG
讀取到xml的文本返回 TEXT

 
PULL解析器小巧輕便,解析速度快,簡單易用,非常適合在Android移動設備中使用,Android系統內部在解析各種XML時也是用PULL解析器,Android官方推薦開發者們使用Pull解析技術。Pull解析技術是第三方開發的開源技術,它同樣可以應用於JavaSE開發。
      PULL 的工作原理:XML pull提供了開始元素和結束元素。當某個元素開始時,我們可以調用parser.nextText從XML文檔中提取所有字符數據。當解釋到一個文檔結束時,自動生成EndDocument事件。
      常用的XML pull的接口和類:
XmlPullParser:XML pull解析器是一個在XMLPULL VlAP1中提供了定義解析功能的接口。
XmlSerializer:它是一個接口,定義了XML信息集的序列。
XmlPullParserFactory:這個類用於在XMPULL V1 API中創建XML Pull解析器。
XmlPullParserException:拋出單一的XML pull解析器相關的錯誤。
PULL的解析流程如下:

      [附加]第四種方式: Android.util.Xml類
在Android API中,另外提供了Android.util.Xml類,同樣可以解析XML文件,使用方法類似SAX,也都需編寫Handler來處理XML的解析,但是在使用上卻比SAX來得簡單 ,如下所示:
以android.util.XML實現XML解析 ,
 代碼如下 復制代碼
MyHandler myHandler=new MyHandler0;
android.util.Xm1.parse(ur1.openC0nnection().getlnputStream0,Xm1.Encoding.UTF-8,myHandler);
 
 下面是一個參考文檔river.xml,放在assets目錄.如下:
 代碼如下

<?xml version="1.0" encoding="utf-8"?>
<rivers>
 <river name="靈渠" length="605">
     <introduction>
      靈渠在廣西壯族自治區興安縣境內,是世界上最古老的運河之一,有著“世界古代水利建築明珠”的美譽。靈渠古稱秦鑿渠、零渠、陡河、興安運河,於公元前214年鑿成通航,距今已2217年,仍然發揮著功用。
     </introduction>
      <imageurl>

圖片ID
      </imageurl>
   </river>
 

  
   <river name="膠萊運河" length="200">
     <introduction>
      膠萊運河南起黃海靈山海口,北抵渤海三山島,流經現膠南、膠州、平度、高密、昌邑和萊州等,全長200公裡,流域面積達5400平方公裡,南北貫穿山東半島,溝通黃渤兩海。膠萊運河自平度姚家村東的分水嶺南北分流。南流由麻灣口入膠州灣,為南膠萊河,長30公裡。北流由海倉口入萊州灣,為北膠萊河,長100余公裡。
  

 代碼如下  </introduction>
      <imageurl>

圖片ID

           </imageurl>
   </river>
  
   <river name="蘇北灌溉總渠" length="168">
     <introduction>
      位於淮河下游江蘇省北部,西起洪澤湖邊的高良澗,流經洪澤,青浦、淮安,阜寧、射陽,濱海等六縣(區),東至扁擔港口入海的大型人工河道。全長168km。
     </introduction>
      <imageurl>

圖片ID

          </imageurl>
   </river>
 </rivers>


  
      采用DOM解析時具體處理步驟是:

1 首先利用DocumentBuilderFactory創建一個DocumentBuilderFactory實例
2 然後利用DocumentBuilderFactory創建DocumentBuilder

3 然後加載XML文檔(Document),
4 然後獲取文檔的根結點(Element),
5 然後獲取根結點中所有子節點的列表

copyright © 萬盛學電腦網 all rights reserved