程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> JAVA綜合教程 >> XML.01-語法簡介,xml.01-語法

XML.01-語法簡介,xml.01-語法

編輯:JAVA綜合教程

XML.01-語法簡介,xml.01-語法


 

 

 

  • XML.01-語法簡介
      • 文檔聲明
      • 元素(標簽)
      • 屬性
      • 注釋
      • 特殊字符
      • CDATA區域
      • 處理指令

啥是XML?
xml (Extensible Markup Language)可擴展的標記語言,顧名思義,XML最重要的兩個因素:

  • 可擴展
  • 標簽,可以自定義的標簽

XML可以看作是HTML的一個超集,但是,兩者設計的目的是不一樣的. HTML的設計目的是顯示信息,而XML的設計目的是傳輸信息.

XML干啥使

  • 用來結構化描述有關系的數據
  • XML可以用來把數據從HTML中分離出來
  • XML可以更好的在異構系統之間傳輸數據
  • XML還大量的被應用於軟件的配置文件

XML現有版本
XML目前有1.0 和1.1 兩個版本,但是1.1不向後兼容1.0,所以大家基本還是在用1.0

XML文件可以分為以下幾部分內容:

  • 文檔聲明
  • 元素
  • 屬性
  • 注釋
  • CDATA區
  • 處理指令(PI)

文檔聲明

  • <?xml version="1.0" encoding="UFT-8" ?>
  • 文檔聲明必須出現在xml的第一行位置.
  • 屬性:
    • version=”1.0” xml的版本
    • encoding=”UTF-8” 編碼集
    • standalone=”[yes|no]” 代表xml是否可以獨立,其實也不寫都可以引入外部文件.

亂碼問題,要保證保存和打開的編碼方式一致(我一直的解決方案就是永遠UTF-8…)

 

元素(標簽)

元素指的是XML文件中出現的標簽,標簽分為起始和結束.

  • 開始和結束標簽
    • 包含標簽主體:<abc>文本</abc>
    • 不包含標簽主體: <abc/>
  • 標簽不能交叉嵌套
  • 只能有且必須有一個根元素

元素的命名規范:

  • 大小寫敏感
  • 不能以數字或-開頭
  • 不能以xml開頭
  • 不能有空格和冒號
  • 不可以包含冒號和空格
  • 不能以xml開頭(大小寫都不行)

屬性

一個元素可以有多個屬性,屬性應該有自己的名字和值.比如<mytag name="value">

  • 在同一元素上不能有相同的屬性
  • 屬性必須用引號(單引號或者雙引號)
  • 屬性可以自定義,並且命名規范與元素一致

XML中的屬性很多時候是可以被轉換成元素的. 比如

<person sex="male">
<name>Brady</name>
</person>

完全可以寫成

<person>
<sex>male</sex>
<name>Brady</name>
</person>

那麼,什麼時候使用屬性,什麼時候使用標簽呢? W3Cschool上那大哥說,盡量把看起來像數據的都用標簽表示.為什麼呢?

  • 屬性無法包含多重值(復雜結構),BUT!!!元素可以!!!
  • 屬性不能描述樹狀結構,BUT!!!元素可以!!!
  • 屬性不易擴展,BUT!!!元素可以!!!
  • 屬性難以閱讀和維護,BUT!!!元素可以!!!

看一個例子,比如要修改下面這個XML,使它更合理,那麼有三種寫法

<note date="08/08/2008">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

普通寫法:

<note>
<date>08/08/2008</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

文藝寫法:

<note>
<date>
<day>08</day>
<month>08</month>
<year>2008</year>
</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

二逼寫法:

<note day="08" month="08" year="2008"
to="George" from="John" heading="Reminder"
body="Don't forget the meeting!">
</note>

上面說把所有看起來像數據的都用標簽,那我看起來所有玩意兒都像數據咋整…

看下面這個例子:

<messages>
<note id="501">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
<note id="502">
<to>John</to>
<from>George</from>
<heading>Re: Reminder</heading>
<body>I will not</body>
</note>
</messages>

這裡就是用了id來作為屬性. 所以這麼說,元數據(用於修飾數據的數據)應當作為屬性來使用,而數據本身應該存儲為元素.

注釋

  • 和HTML的注釋,一毛一樣 <!-- -->
  • 注釋不能嵌套

特殊字符

  • < &lt;
  • > &gt;
  • & &amp;
  • quot;
  • &apos;

CDATA區域

PCDATA區域值的是被解析的字符數據,(Parsed Character Data)
CDATA區域中的文本會被解析器忽略,也就是說CDATA區域的字符串僅僅就是個字符串不會被作為XML解析.

<![CDATA[
內容會被看作字符串
]]>

CDATA區域的作用:
在XML中的< 和&是非法的,可以通過轉義字符來解決,但是如果一個文本區域出現大量的類似字符,轉義字符就很麻煩.
這時候可以使用CDATA區域來解決這個問題.

處理指令

處理指令,簡稱PI(Processing Instruction),是用來指揮軟件如何解析XML文檔的.被<? ?>包裹起來的就是PI,比如前面說到的XML文檔聲明其實就是一個PI.
這個貌似用處不是很大…不想看了

 

 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved