XML срещу XHTML
Разширяващият се език за маркиране (известен също като XML) е набор от правила. Тези правила са специфични за документи, кодиращи по електронен път. Основната цел на XML е да подчертае простотата, общата и използваемостта по интернет. XML се отбелязва като формат на текстови данни, който има поддръжка от Unicode за лесно четене на всички езици. Въпреки че основната цел на XML дизайна е да се съсредоточи конкретно върху документите, той често се използва и за представяне на произволни структури от данни (например уеб услуги). В момента има множество програмни интерфейси, които разработчиците са в състояние да използват за достъп до XML данни. Съществуват и разнообразни схеми, които са създадени специално за подпомагане на дефинирането на XML базирани езици.
Разширяемият език за маркиране на хипертекста (известен още като XHTML) е част от семейството на езика за маркиране на XML. Той всъщност симулира или просто действа като разширение на езика за маркиране на хипертекста (или HTML). XHTML действа като приложение от семейството на XML и е по-ограничаващо подмножество от SGML. В резултат на добре оформения характер на XHTML документи е възможно те да бъдат анализирани с помощта на XML анализатор - което допълнително разграничава XHTML от HTML.
XML документ се състои изцяло от знаци, открити в Unicode. Има няколко контролни знака, които са изключени от Unicode; тези, които се намират в Unicode, могат да станат съдържание в XML документ. Има множество съоръжения, които идентифицират кодирането на Unicode символи в XML документ. Има и съоръжения, които изразяват онези знаци, които не могат да бъдат използвани. Unicode се кодира в байтове, за да се съхранява или предава - тези преведени изрази на Unicode са известни като кодиране. XML използва всички, ако не всички, кодировки, определени с Unicode, както и редица различни кодировки, чиито символи се появяват в Unicode. Той осигурява механизъм, който позволява на XML процесор да определи кое кодиране се използва.
Има три специфични версии на XHTML: XHTML 1.0 Strict, който включва елементи и характеристики, които не са маркирани оттеглени в HTML 4.01; XHTML 1.0 Transitional, който включва елементи, специфични за презентациите (например 'font' и 'strike'); и XHTML 1.0 Frameset, което позволява да се дефинират документи за рамка. XHTML също може да бъде модулиран, което осигурява абстрактна колекция от атрибути, чрез които XHTML може да бъде подмножена и разширена. Това е просто средство за подпомагане на XHTML в разширяването на обхвата му в други видни платформи (например мобилни устройства и телевизия с активирана мрежа).
Резюме:
1. XML е набор от правила, които се задават за кодиране на документи; XHTML е XML еквивалент на HTML, който е по-рестриктивен подмножество от SGML.
2. XML се състои изцяло от Unicode; XHTML се предлага в три версии: XHTML 1.0 Strict, XHTML 1.0 Transitional и XHTML 1.0 Frameset.