Hovedforskel: XML står for Extensible Markup Language. Det er en specifikation udviklet af W3C. Det er et markup-sprog designet specielt til webdokumenter. Det definerer et sæt regler for kodning af dokumenter i et format, der både er læsbart og maskinlæseligt. HTML står for HyperText Markup Language. Det er et velkendt markup-sprog, der bruges til at udvikle websider. Det har eksisteret i lang tid og er almindeligt anvendt i webside design.
XML er et tekstbaseret datformat med stærk support via Unicode til sprog. Det understreges enkelhed, generelitet og brugervenlighed over internettet. Det bruges også i vid udstrækning til repræsentation af vilkårlig datastruktur, især i webtjenester. Programmører bruger ofte API'er, mens de behandler XML-data og skema systemer til at hjælpe i definitionen af XML-baserede sprog.
XML-syntaksen har dannet grundlaget for mange dokumentformater, såsom RSS, Atom, SOAP og XHTML. Faktisk er XML-baserede formater blevet standard for mange værktøjer til kontorproduktivitet, herunder Microsoft Office, OpenOffice.org og LibreOffice og Apples iWork.
HTML er skrevet ved hjælp af HTML-elementer, som består af tags, primært og åbning tag og en afsluttende tag. Dataene mellem disse tags er normalt indholdet. Hovedformålet med HTML er at tillade webbrowsere at fortolke og vise indholdet skrevet mellem tags. Etiketterne er designet til at beskrive sidens indhold. HTML leveres med foruddefinerede tags. De tillader en at indsætte billeder, tekst, videoer, formularer og andre indholdstyper sammen i en sammenhængende webside.
Elementer af HTML er de grundlæggende byggesten på alle hjemmesider. HTML gør det muligt at indlejre billeder og objekter på websiden. Det kan også bruges til at oprette interaktive former. HTML giver også midler til at oprette strukturerede dokumenter. Det gør det ved at angive strukturelle semantik for tekst som overskrifter, afsnit, lister, links, citater og andre elementer. Men i disse dage er websider sjældent designet med kun HTML. HTML gør det muligt for programmøren at integrere script skrevet på sprog som JavaScript, som mange ofte gør. Dette ændrer udseendet og opførelsen af HTML-websiderne.
Nogle forskelle mellem XML og HTML:
- HTML blev designet til at vise data med fokus på, hvordan data ser ud, mens XML blev designet til at være et software- og hardwareafhængigt værktøj, der bruges til at transportere og gemme data, med fokus på hvilke data der er.
- HTML er et markup-sprog, mens XML giver en ramme for at definere markup-sprog.
- HTML er et præsentationssprog, mens XML ikke er et programmeringssprog eller et præsentationssprog.
- HTML er uhensigtsmæssigt, mens XML er sagerfølsomt.
- HTML bruges til at designe en webside, der skal gengives på klientsiden, mens XML bruges grundlæggende til at transportere data mellem applikationen og databasen.
- HTML har foruddefinerede tags, mens XML har brugerdefinerede tags, der kan opfindes eller defineres af programmøren.
- HTML kræver ikke lukkekoder, mens i XML er lukkekoder obligatorisk for hver tag.
- HTML bevarer ikke hvidt rum, mens XML gør.
- HTML handler om at vise data, mens XML handler om at beskrive data.
- HTML er statisk, mens XML er dynamisk.
- I XML er dataudveksling mulig, mens der ikke er mulighed for HTML-dataudveksling.
- I XML skal attributværdi være indeholdt i citatmærker, mens i HTML-attributværdier kan være til stede uden anførselstegn.
- I XML, hvis attribut er defineret, skal den have værdi, og i HTML-attributværdier kan være til stede uden værdier.
- I XML kan modularitet leveres af DTD, mens der i HTML ikke findes noget koncept for DTD.
- XML bruges til præsentation og HTML bruges til repræsentation.
- XML bruges som lagringsmedie, mens der i HTML ikke er noget begreb om lagring.
- HTML er fejlfrit sprog, mens XML ikke er.
- I XML bruges parsing til at udføre XML-filerne, men i HTML er der ingen mulighed for parsering.
- I HTML er der ingen datatype, mens i XML er nogle datatyper defineret.
- Et HTML-dokument er måske ikke velformet dokument, mens et XML-dokument skal være et velformet dokument.