Les définitions de type de document (DTD) ont rapidement laissées apparaître des carences dans le domaine des contraintes de structures et de données.

De plus, la syntaxe des DTD est issue du langage EBNF (Extended Backus Naur Form), beaucoup plus compliqué et lourd que ne l'est le langage XML.

L'universalité du langage XML requiert la création d'un ensemble d'applications verticales allant de la définition des documents (langage de schéma), en passant par leur structuration et composition (langage XML) et jusqu'à leur présentation à l'utilisateur final (langage XSL). L'adoption d'un langage de définition des documents basé sur XML, était donc inévitable afin de conserver une homogénéité dans la sphère XML déjà fort bien pourvue.

Le langage de schéma XML apporte une grande souplesse et une puissance inégalée dans la définition des documents XML.

La fonctionnalité la plus remarquable des schémas XML est la prise en charge des types de données garantissant le contenu a affecter à un élément XML et apportant une validation plus efficace, non seulement sur la structure du document, mais aussi sur son contenu. Ainsi, une balise destinée à accueillir une date sera définie comme telle dans le schéma et par la suite sera en mesure de délivrer sa valeur à un programme sans soucis de conversion d'une chaîne de caractères en date.

Le modèle de contenu devient davantage exhaustif avec les schémas XML qu'il ne l'était auparavant avec les DTD. En effet, outre que les schémas définissent tous les éléments et la structure constituant un document XML, ils déterminent également le nombre d'occurrences des éléments, gérent les contenus mixtes, les éléments nommés, les groupes d'attributs ainsi que des annotations utilisés pour la création d'une documentation à propos du modèle de contenu.

L'extensibilité des définitions des documents apportée par les schémas XML, facilite l'échange, la fusion ou la réutilisation de données provenant d'une ou plusieurs sources. Effectivement, à l'instar des documents XML, les schémas XML pourront désormais se combiner en se fusionnant complètement ou partiellement afin de créer un modèle de contenu composite. D'ailleurs, plusieurs schémas peuvent être référencés à l'intérieur d'un unique document XML et donc valider la structure et le contenu de ce dernier.

La génération dynamique de documents XML et du modèle de contenu associé, devient alors beaucoup plus commode. Evidemment, cela demande une certaine compatibilité entre les schémas susceptibles d'être combinés. Grâce à cette normalisation, des schémas XML provenant d'un fournisseur pourront être fusionnés sans peines avec ceux d'un distributeur dans le but de créer un modèle de contenu spécifique destiné à la validation de documents XML générés à la volée.

Le langage de schémas constitue donc une pièce essentielle dans la sphère XML, assurant une évolutivité, un dynamisme et une souplesse que ne pouvait assumer le langage de DTD.

Les spécifications de schémas XML peuvent être consultées directement sur le site du W3C ou sur XMLfr pour une tradutcion de XML Schema tome 0 et XML Schema tome 1.