Introduction

eXtensible Markup Language est une spécification proposée par le W3C (World Wide WConsortium) en 1998 et qui s’est imposé comme un standard incontournable . De plus, le  langage  XML est format général de documents orienté texte. C’est, aussi, un sous-ensemble de SGML (Standard Generalized Markup Language)  

xml introduction

Les avantages de XML :

  • Ce langage utilise un langage humain et non informatique. Donc, c’est un langage lisible et compréhensible
  •  Il est extensible : permet de définir ses propres balises et ses propres attributs. 
  • Un document XML peut être validé par des règles strictes, contenues par des DTD ou des Schémas, décrivant sa structure et la hiérarchisation de ses données.
  • On a une séparation stricte entre contenu et présentation. En effet, le traitement de la mise en forme est rigoureusement séparé de la structure du document XML.
  • Il est un format standardisé ouvert ne nécessitant aucune licence, intégralement basé texte et qui peut être associé à n’importe quel jeu de caractères.
  • Langage très utilisé soit pour le stockage de document, pour l’échange de données entre applications, comme fichier de configuration,…
  • …. 

Remarque : 

Plusieurs technologies et de langages qui se sont développés autour de XML. Ceux-ci enrichissent, alors, les outils pour la manipulation des documents XML. La liste ci-dessous énumère les principaux langages qui font partie de l’environnement XML. 

  • XLink et XPointer (liens entre documents)
  • XPath (langage de sélection)
  • XQuery (langage de requête)
  • XSD (modèles de documents)
  • XSLT (transformation de documents) 

Structure de base d'un fichier XML

 Pour qu’un document XML soir correct, il doit d’abord être bien formé et, ensuite, être valide. La première contrainte est de nature syntaxique (concerne les règles d’écriture) et la seconde contrainte est de nature structurelle (le document doit respecter le modèle d’organisation). Un tel document est généralement contenu dans un fichier texte dont l’extension est ‘.xml’.

En d’autres termes, le document se découpe en deux parties consécutives qui sont le prologue et le corps. Les commentaires et les instructions de traitement sont ensuite librement insérés avant, après et à l’intérieur du prologue et du corps. De façon générale, la structure globale d’un document est la suivante :

               Prologue  .
          
          ⌉
  ...                   |   Corps
         ⌋ 

Prologue :

Le prologue contient deux déclarations facultatives mais fortement conseillées (comme les commentaires et des instructions de traitement  : voir en bas du cours). Alors, la ligne d’introduction du document (prologue) est : <!–?xml version=”1.0″ encoding=”iso-8859-1″ standalone=”no”?–>

Cette ligne permet donc d’indiquer la version XML utilisée, le jeu de caractères utilisé et l’autonomie du document tel que :
– La version XML : soit 1.0 ou 1.1, sachant que la très grande majorité des documents sont en version 1.0 et que la version 1.1 est assez décriée
– L’Encoding : Le jeu de caractères employé (UTF-8 est l’encoding pris par défaut)

standalone : désigne l’indépendance du document, au sens où il n’existe aucun élément externe qui puisse altérer la forme finale du document XML fourni à l’application par le parseur (références d’entités, valeurs par défaut…). Ce champ prend les valeurs yes ou no. Dans la pratique, il n’a pas grand intérêt et vous pouvez l’ignorer. Si l’attribut standalone est omis, c’est la valeur no qui est prise par défaut.

Exemple : Si il n’y a pas de DTD ou si elle est interne, le document est autonome et la valeur de l’attribut standalone peut être définie à yes. Si la DTD référencée est externe la valeur de cet attribut doit être définie à no. 

Remarques : 

– Les attributs encoding et standalone sont facultatifs.

– Le prologue n’est pas obligatoire et, dans ce cas, le comportement par défaut (version 1.0 et encoding UTF-8) est utilisé.

 

L’élément racine :

L’élément racine est lui aussi obligatoire. De plus, Cet élément est une balise unique dans le document. Elle encadrera le contenu de votre document . 

Attention : N’oubliez pas que XML est sensible à la casse, par conséquent <tag> et <Tag> n’ont pas la même signification.

Pour notre exemple, nous nommerons l’élément racine librairie :

<?xml version=”1.0″ encoding=”iso-8859-1″?>

<librairie>

</librairie>

  • Le contenu :

 le document XML est organisé sous format éléments, dont l’un est l’élément racine. D’où, un élément est formé d’une balise ouvrante, d’un contenu et de la balise fermante correspondante 

contenu xml
Tous les éléments doivent avoir une balise d’ouverture et une balise de fermeture sauf l’élément vide. Aussi,  On peut avoir des éléments imbriqués (attention aux fermetures) , des éléments ayant des attributs et d’autres cas qu’on va traiter au fur et à mesure dans ce cours. Exemple 1 :
- <LIVRE> . . . </LIVRE> 
- <fichier chemin="cours.pdf"/>  

Exemple 2 : document bien formé 
<?xml version="1.0" encoding="iso-8859-1"?>
<stagiaires> 
<stagiaire> 
<numi>1025</numi> 
<nom>khalidi</nom> 
<prenom>ahlam</prenom> 
<groupe>tdm102</groupe> 
</stagiaire>
<stagiaire> 
<numi>5204</numi> 
<nom>IdAli</nom> 
<prenom>Khalid</prenom> 
<groupe>TRI102</groupe> 
</stagiaire> 
</stagiaires>  

Test :

 Ouvrez un éditeur de texte et composez ces quelques lignes. Enregistrez le fichier avec l’extension .xml et ouvrez le dans MSIE. Vous remarquez que le fichier apparaît sous forme d’arborescence.
Remarque : Pour visualisé un document XML, il vaut faut un ‘parser XML ‘ (parseur en français). Un parseur est un analyseur syntaxique. La plupart des navigateurs possèdent un tel parseur .
Remarque : Certains caractères ayant une signification particulière dans la grammaire du XML restent interdits : < , > , & .Pour ces caractères comme pour les caractères pouvant poser des problèmes à l’affichage utilisez les caractères de masquages (d’échappement) soit sous forme d’entités nommées, soit sous forme d’entités codées.

entités xml
  • Commentaires, Instructions de traitement et section CDATA
    1.  Les commentaires :
      Les commentaires sont introduits dans un document XML comme dans un document HTML : <!–commentaires –>
    2.  Instructions de traitement :
      Elles permettent de fournir des informations supplémentaires sur le document aux analyseurs syntaxiques. Premièrement, une instruction de traitement commence par <? et se termine par ?>. La plus utilisée de ces instructions est celle constituant le prologue d’un document XML : <!–?xml version=”1.0″?–>.

      Aussi, l’inclusion d’une référence à une feuille de styles utilise ce type d’instruction.
    3.  Section CDATA :
      Cette section permet d’inclure des données textuelles, des exemples de code…, dans un document XML sans qu’il soit nécessaire de substituer les caractères spéciaux par des caractères de masquage. La mise en oeuvre d’une section CDATA s’écrit ainsi : 

      <![ CDATA[ ]]>
      

      Remarque : Les sections CDATA ne peuvent pas être imbriquées

On vous propose une vidéo très importante où nous expliquons (En darija Marocaine) cette partie de cours :

Vous pouvez suivre notre cours complet d’XML . pour approfondir vos compétences sur la création et la manipulation des documents xml, dtd, xsd,xpath, xslt.

Aussi, vous avez une playlist des vidéos (Explication en Darija arabe marocaine)  bien organisée qui traite : XML DTD XSD XSLT XPATH

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *