下面是一份在 HTML 4 Strict 和 XHTML 1.0 Strict 下必須遵守的標簽嵌套規則,比如你不能在 <a> 裡面再嵌入一個 <a> 這樣的約定。
說明:
為了方便讀者閱讀,本文中的標簽使用了大寫(根據 XHTML 的規則,元素名必須小寫,比如 <html> 而不應是 <HTML>)
小寫的單詞表明一組或一系列 HTML 標簽
每一項條目(標簽)後都跟隨一組標簽列表,如果沒有這個列表,那麼表明該條目(標簽)內部不允許包含任何標簽。這意味著該條目內部只能包含純文本內容(#PCDATA,見下文)。如果注明 (empty),這意味著該條目內部不允許包含任何形式的內容。對於flow,inline,block,OBJECT 和 BODY,其內部允許包含的內容在文中會單獨給出。
#PCDATA 的意思是“parsed character data”,即純文本內容(不包括任何 HTML 標簽,但是轉義內容可以存在,比如 ä 和 ä)
CDATA 的意思是“character data”,這意味著不包括轉義內容的純文本內容,詳細內容可以參考CDATA Confusion
excluding ... 意即不得直接或者間接的包含所列的元素
注1. 以上內容基於 [HTML 4.01 Specification] 的 Strict DTD。JunChen 翻譯自 Allowed nesting of elements in HTML 4 Strict (and XHTML 1.0 Strict)
注2. 對於 XHTML 1.0,基本上一致,不同點如下:
對於 <script> 和 <style> 的內容,在 HTML 4 裡是 CDATA 而在 XHTML 裡是 #PCDATA
在 XHTML 中,<table> 標簽後可以緊跟一個 <tr>,而在 HTML 4.01 裡,不允許這樣,不過 <tbody> 標簽又是可以省略的。意思就是說,如果代碼中的 <table> 後緊跟 <tr>,對於 HTML 4.01,會隱性的生成一個 <tbody> 標簽,而在 XHTML 裡面就沒有。這會影響到樣式表使用 tbody 作為選擇器。