本章介紹了 XML 字符實體。在我們了解字符實體之前,先了解一下什么是 XML 實體。
W3 聯(lián)盟 對實體的定義如下:
文檔實體作為實體樹的根元素和 XML 處理程序的起點。
這意味著實體就是 XML 中的占位符。它們可以聲明在文檔序言或者DTD中。實體有不同的類型,本章后面會討論字符實體。
HTML 和 XML 都有一些符號被保留使用,它們不能在 XML 代碼中用作內(nèi)容。例如,< 和 > 符號被用作 XML 標(biāo)簽的開頭和結(jié)尾。要顯示這些特殊字符,就要使用字符實體。
有些特殊的字符或符號還不能直接使用鍵盤輸入。可以使用字符實體來顯示這些符號或特殊字符。
有三種類型的字符實體:
引入它們是為了避免使用某些有歧義的符號。例如,當(dāng)我們把小于(<)或大于(>)符號當(dāng)尖括號(<>)使用時就會產(chǎn)生歧義。字符實體從根本上來說就是用來界定 XML 標(biāo)簽的。下面是一個來自 XML 規(guī)范的預(yù)定義字符實體列表。它們可以用來表示某些字符而不帶歧義。
數(shù)字引用被用來表示字符實體。數(shù)字引用可以是十進(jìn)制或十六進(jìn)制格式。由于有數(shù)以千記的數(shù)字引用,導(dǎo)致很難記住它們。數(shù)字引用通過使用字符在 Unicode 字符集中的編碼數(shù)值來表示。
十進(jìn)制數(shù)字引用基本語法:
&# decimal number ;
十六進(jìn)制數(shù)字引用基本語法:
&#x Hexadecimal number ;
下面的表格列出了一些預(yù)定義字符實體和它們對應(yīng)的數(shù)值:
| 實體名稱 | 字符 | 十進(jìn)制引用 | 十六進(jìn)制引用 |
|---|---|---|---|
| quot | " | " | " |
| amp | & | & | & |
| apos | ' | ' | ' |
| lt | < | < | |
| gt | > | > | > |
正如上面所說的,數(shù)值字符很難記住,最受歡迎的字符實體類型是命名字符實體。因為每個實體都用一個名稱標(biāo)識。
例如: