Les documents XML sont construits à partir d'une ou plusieurs entités internes ou externes.
Ces denières possèdent un contenu et un identifiant, en l'occurrence une valeur d'entité et un nom d'entité.
Tout document XML possède au moins une entité correspondant à la Déclaration de Type de Document et l'élément racine. Cette entité s'appelle entité document.
Les entités peuvent contenir des données XML bien formulées, d'autres formes de texte comme des courriers électroniques ou des données binaires comme des images ou des applets Java.
Les noms d'entités obéissent aux mêmes règles que les noms d'éléments ou d'attributs. Ils ne peuvent être constitués que de lettres, y compris les lettres accentuées, de chiffres, de soulignés (_), de tirets (-), de points (.) et de deux-points (:). Toutefois le nom d'entité ne peut commencer que par une lettre ou un souligné.
Deux catégories d'entités se distinguent. Il s'agit des entités internes, définies et utilisables dans le document XML, et les entités externes, définies dans une ressource externe et utilisable dans le document via une adresse URL (Uniform Resource Locator).
Deux autres types d'entités apparaissent également : les entités analysables dont le contenu est entièrement conforme à un XML bien formé, et les entités non-analysables correspondant à un contenu composé de texte non-XML ou de données binaires.
Enfin, les entités se divisent encore en deux parties. Les entités générales permettent d'utiliser leur contenu essentiellement dans le document XML hors DTD. Les entités paramètres sont utilisables exclusivement dans la Déclaration de Type de Document.
Sommaire