Obecnie w internecie obowiązują dwa języki: starzejący się już HTML oraz zastępujący go XHTML. Którego z nich używać? Jak przygotowywać strony WWW zgodne ze standardami?
Język HTML
Rozwój języka HTML został wstrzymany w roku 1999. Wtedy ukazała się jego ostatnia specyfikacja, zatytułowana HTML 4.01 Specification, opisująca język HTML w wersji 4.01. Dokument ten sygnalizował trendy, które zaczynały obowiązywać w dziedzinie publikacji internetowych. Głównie chodzi o oddzielenie prezentacyjnych cech witryny od jej struktury (poprzez stosowanie stylów).
Specyfikacja definiuje trzy dialekty języka: strict, transitional oraz frameset. Wprawdzie w żadnym miejscu dokumentu nie jest to jasno powiedziane, ale moim zdaniem należy się skupić na języku HTML 4.01 w wersji strict. Jest to szczególnie ważne, gdy myślimy o tworzeniu witryn WWW i planujemy publikowanie stron zgodnych ze standardami.
Treść dokumentów HTML 4.01 strict oraz XHTML 1.0 strict różni się ośmioma szczegółami.
Język XHTML
Specyfikacja języka XHTML 1.0 jest datowana na 26 stycznia 2000 roku. Język XHTML nie jest nowym językiem, a jedynie modyfikacją języka HTML. We wstępie specyfikacji XHTML stwierdzono, że w specyfikacji języka XHTML nie opisano żadnego ze znaczników.
Szukając opisu elementów, ich atrybutów oraz zdarzeń musimy zajrzeć do specyfikacji języka HTML. Specyfikacja XHTML 1.0 definiuje jedynie zmiany, które należy wprowadzić w dokumencie HTML, by stał się on dokumentem XHTML.
Podobnie jak HTML 4.01, również język XHTML 1.0 zawiera trzy dialekty: strict, transitional oraz frameset (najlepiej stosować wersję strict). Dostępne wersje języka XHTML to: 1.0, 1.1 oraz 2.0. Z racji na surowe wymagania (każdy dokument XHTML 1.1 musi być wysyłany jako application/xhtml+xml, XHTML 2.0 nie jest zgodny w dół z poprzednimi językami) powszechnie stosowana jest wyłącznie wersja 1.0 języka XHTML.
XHTML zgodny z HTML-em
Powszechnie stosowanym rozwiązaniem (zalecanym również przez W3C) jest przygotowywanie dokumentów w języku XHTML w taki sposób, by były one – na ile to możliwe – poprawnymi dokumentami HTML.
Wprawdzie pełna zgodność nie jest możliwa, jednak w zasadniczej części (czyli pomiędzy znacznikami {html}
{/html} oraz {html}{/html}) dokumenty w języku XHTML 1.0 strict różnią się od dokumentów HTML 4.01 strict ośmioma szczegółami. Podane rozwiązania możemy stosować zarówno w językach XHTML, jak i HTML.Wielkość liter
W języku HTML nazwy znaczników oraz atrybutów mogły być zapisywane dowolnymi literami. Wszystkie poniższe przykłady są poprawne w języku HTML:
HTML 4.01 strict – poprawny
XHTML 1.0 strict – niepoprawny
white
black
gray
silver
Specyfikacja HTML stosuje konsekwentnie do zapisu nazw znaczników duże litery, a do atrybutów małe. Nie jest to jednak wymóg; decydują o tym jedynie względy estetyczne i upodobanie autorów specyfikacji. W języku XHTML nazwy znaczników oraz atrybutów muszą być zapisywane małymi literami.
HTML 4.01 strict – poprawny
XHTML 1.0 strict – poprawny
white
black
Indeks
nothing
Menu
Wartości atrybutów, takich jak id czy href, mogą być zapisywane literami dowolnej wielkości. Jednak powyższe ograniczenie dotyczy również wartości atrybutów wyliczeniowych. Na przykład typ elementu input należy koniecznie zapisywać małymi literami:
HTML 4.01 strict – poprawny
XHTML 1.0 strict – poprawny