文章詳情頁
xml中的空格之完全解說
瀏覽:269日期:2022-06-04 14:16:48
提示:我提取了《xslt從入門到精通》中關(guān)于空格解釋的核心部分,借以拋磚引玉,希望大家踴躍參與討論。談?wù)勀銓崭竦睦斫狻?
只適合對xml文件結(jié)構(gòu)有一定了解的學(xué)者,不適合初學(xué)者。請按從上至下的順序閱讀。
對html文件而言,空格不重要;然而,對xml而言,默認(rèn)立場就是要保留空格結(jié)點(空格結(jié)點的解釋見下文)。
根據(jù)xml規(guī)范的規(guī)定,所謂空格是四種字符的任意組合序列:
-----------------------
空格字符(space),對應(yīng)字符值為 #x20
返回字符(Carriage Return),對應(yīng)字符值為 #xD
新行字符(Newline),對應(yīng)字符值為 #xA
跳格字符(Tab),對應(yīng)字符值為 #x9。
xml文件的空格也會形成結(jié)點,也就是空格結(jié)點。空格結(jié)點屬于文字結(jié)點類型。
對xml和xslt而言,空格結(jié)點會牽涉到兩個議題:
-----------------------
1。在xml輸入文件中決定哪些空格是重要的,xslt處理器要看見這些空格結(jié)點。而決定的密鑰就是xml:space屬性。
2。在xsl模板文件中決定哪些空格是重要的,xslt處理器應(yīng)將它復(fù)制到結(jié)果樹中,而決定的密鑰就是xsl:strip-space
和xsl:preserve-space這兩個命令。
“重要和不重要的空格結(jié)點”
-----------------------
若某組件的內(nèi)容只能放組件,則該組件中的空格結(jié)點就是不重要的(Insignificant);
如果某組件的內(nèi)容是#PCDATA的類型,則其內(nèi)的空格結(jié)點應(yīng)視為重要的(Signficant)。
至于組件內(nèi)容混雜了文字內(nèi)容和組件的情況則無從評判,應(yīng)視組件及其內(nèi)容之語意而定。
xslt處理器接觸到xml輸入文件之前,會先由xml分析器進(jìn)行分析
-----------------------
(1)xml:space屬性可以改變后續(xù)接手的xml應(yīng)用程序處理空格結(jié)點的模式,例如,xslt處理器就會受xml:space屬性影響。
(2)xml文件中任何一列標(biāo)記或內(nèi)容尾端的結(jié)尾的結(jié)尾符號全部會換成單一新行字符(#xA)。
(3)屬性值交給xml應(yīng)用程序之前,xml分析器也應(yīng)該先對屬性值做規(guī)范化的操作。這是因為不同的操作系統(tǒng)每一行文字列的結(jié)尾字符有不同的組合,例如,windows系統(tǒng)會由返回字符呵新行字符組成結(jié)尾符號,而Unix系統(tǒng)則僅由新行字符組
成結(jié)尾符號。xml分析器在讀取xml文件之后,便先行將所有結(jié)尾符號換成單一新行字符,不僅統(tǒng)一了不同系統(tǒng)間不同結(jié)尾符號設(shè)計的差異性,同時也簡化了后續(xù)xml應(yīng)用程序的的操作難度。這樣一個處理過程稱為“規(guī)范化(Normalization)”。
a,每一文字列的結(jié)尾符號都要規(guī)范化成單一的新行字符(#xA)。
b,任何一個空格符(#x20、#xD、#xA、#x9)都應(yīng)換成一個空格字符(#x20)。
c,屬性值中若含有字參碼,則應(yīng)替換成該參考字符,例如,
會換成新行字符(#xA)。
d,屬性值若含有實體參考,則應(yīng)以其替換文字替換。
e,除此之外,任何字符都應(yīng)直接放入規(guī)范化屬性值中。
f,最后,如果屬性類型不是CDATA,則xml分析器應(yīng)該再進(jìn)一步把屬性值前后的空格字符序列刪除,而且屬性值中間若有空格序列,也應(yīng)該替換成單一空格字符。
xslt處理器把xml輸入文件和xsl模板文件的結(jié)構(gòu)樹建好之后,會現(xiàn)把組件中相鄰的文字結(jié)點合并成單一的文字結(jié)點,然后再把一些文字結(jié)點抽掉。然而,如果文字結(jié)點符合下列條件之一,就會被保留下來:
-----------------------
(1)文字結(jié)點的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結(jié)點中至少有一個非空格符。
(3)文字結(jié)點的某個祖先組件中有xml:space屬性,其值為preserve,而且較近的祖先組件中沒有其他xml:space屬性值為default。除此之外的文字結(jié)點逗會被抽掉。
對xsl模板而言,所謂的空格保留組件名稱集只有一個xsl:text組件可用。xsl模板文件的空格結(jié)點都會被刪除,但是,如果空格結(jié)點出現(xiàn)在xsl:text組件中就會被保留下來。
只適合對xml文件結(jié)構(gòu)有一定了解的學(xué)者,不適合初學(xué)者。請按從上至下的順序閱讀。
對html文件而言,空格不重要;然而,對xml而言,默認(rèn)立場就是要保留空格結(jié)點(空格結(jié)點的解釋見下文)。
根據(jù)xml規(guī)范的規(guī)定,所謂空格是四種字符的任意組合序列:
-----------------------
空格字符(space),對應(yīng)字符值為 #x20
返回字符(Carriage Return),對應(yīng)字符值為 #xD
新行字符(Newline),對應(yīng)字符值為 #xA
跳格字符(Tab),對應(yīng)字符值為 #x9。
xml文件的空格也會形成結(jié)點,也就是空格結(jié)點。空格結(jié)點屬于文字結(jié)點類型。
對xml和xslt而言,空格結(jié)點會牽涉到兩個議題:
-----------------------
1。在xml輸入文件中決定哪些空格是重要的,xslt處理器要看見這些空格結(jié)點。而決定的密鑰就是xml:space屬性。
2。在xsl模板文件中決定哪些空格是重要的,xslt處理器應(yīng)將它復(fù)制到結(jié)果樹中,而決定的密鑰就是xsl:strip-space
和xsl:preserve-space這兩個命令。
“重要和不重要的空格結(jié)點”
-----------------------
若某組件的內(nèi)容只能放組件,則該組件中的空格結(jié)點就是不重要的(Insignificant);
如果某組件的內(nèi)容是#PCDATA的類型,則其內(nèi)的空格結(jié)點應(yīng)視為重要的(Signficant)。
至于組件內(nèi)容混雜了文字內(nèi)容和組件的情況則無從評判,應(yīng)視組件及其內(nèi)容之語意而定。
xslt處理器接觸到xml輸入文件之前,會先由xml分析器進(jìn)行分析
-----------------------
(1)xml:space屬性可以改變后續(xù)接手的xml應(yīng)用程序處理空格結(jié)點的模式,例如,xslt處理器就會受xml:space屬性影響。
(2)xml文件中任何一列標(biāo)記或內(nèi)容尾端的結(jié)尾的結(jié)尾符號全部會換成單一新行字符(#xA)。
(3)屬性值交給xml應(yīng)用程序之前,xml分析器也應(yīng)該先對屬性值做規(guī)范化的操作。這是因為不同的操作系統(tǒng)每一行文字列的結(jié)尾字符有不同的組合,例如,windows系統(tǒng)會由返回字符呵新行字符組成結(jié)尾符號,而Unix系統(tǒng)則僅由新行字符組
成結(jié)尾符號。xml分析器在讀取xml文件之后,便先行將所有結(jié)尾符號換成單一新行字符,不僅統(tǒng)一了不同系統(tǒng)間不同結(jié)尾符號設(shè)計的差異性,同時也簡化了后續(xù)xml應(yīng)用程序的的操作難度。這樣一個處理過程稱為“規(guī)范化(Normalization)”。
a,每一文字列的結(jié)尾符號都要規(guī)范化成單一的新行字符(#xA)。
b,任何一個空格符(#x20、#xD、#xA、#x9)都應(yīng)換成一個空格字符(#x20)。
c,屬性值中若含有字參碼,則應(yīng)替換成該參考字符,例如,
會換成新行字符(#xA)。
d,屬性值若含有實體參考,則應(yīng)以其替換文字替換。
e,除此之外,任何字符都應(yīng)直接放入規(guī)范化屬性值中。
f,最后,如果屬性類型不是CDATA,則xml分析器應(yīng)該再進(jìn)一步把屬性值前后的空格字符序列刪除,而且屬性值中間若有空格序列,也應(yīng)該替換成單一空格字符。
xslt處理器把xml輸入文件和xsl模板文件的結(jié)構(gòu)樹建好之后,會現(xiàn)把組件中相鄰的文字結(jié)點合并成單一的文字結(jié)點,然后再把一些文字結(jié)點抽掉。然而,如果文字結(jié)點符合下列條件之一,就會被保留下來:
-----------------------
(1)文字結(jié)點的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結(jié)點中至少有一個非空格符。
(3)文字結(jié)點的某個祖先組件中有xml:space屬性,其值為preserve,而且較近的祖先組件中沒有其他xml:space屬性值為default。除此之外的文字結(jié)點逗會被抽掉。
對xsl模板而言,所謂的空格保留組件名稱集只有一個xsl:text組件可用。xsl模板文件的空格結(jié)點都會被刪除,但是,如果空格結(jié)點出現(xiàn)在xsl:text組件中就會被保留下來。
標(biāo)簽:
XML/RSS
相關(guān)文章:
1. Jsp中request的3個基礎(chǔ)實踐2. 三個不常見的 HTML5 實用新特性簡介3. ASP基礎(chǔ)入門第三篇(ASP腳本基礎(chǔ))4. 得到XML文檔大小的方法5. 將properties文件的配置設(shè)置為整個Web應(yīng)用的全局變量實現(xiàn)方法6. CSS Hack大全-教你如何區(qū)分出IE6-IE10、FireFox、Chrome、Opera7. jsp網(wǎng)頁實現(xiàn)貪吃蛇小游戲8. XML解析錯誤:未組織好 的解決辦法9. React實現(xiàn)一個倒計時hook組件實戰(zhàn)示例10. 解析原生JS getComputedStyle
排行榜