Ce document est destiné aux étudiants de l'Université Blida, Faculté de Science, Département d'Informatique, en troisième année de Licence en Informatique et Systèmes d'Information (L3 ISIL) pour l'année académique 2022/2023.
Il couvre les notions suivantes:
- Maîtrise de la syntaxe de base du langage XML et de la modélisation XML.
- Règles de bien-formage des documents XML.
- Exercices pratiques sur la création et la validation de documents XML.
- Modélisation XML pour des structures complexes comme des livres et des hôpitaux.
- Structuration de textes en fichiers XML.
Exercices TP Langage XML Syntaxe de base -DSS - XML, DTD, XML
Télécharger PDFUniversité Blida
Faculté de science
Département d’informatique
Données semi-structurées L3 ISIL 2022/2023
Série de TP 1 : Langage XML Syntaxe de base
Objectif :
L’objectif de ce TP, est de maitriser la syntaxe de base du langage XML, ainsi que la modélisation XML.
Rappel
XML est un langage qui permet de décrire des données semi-structurées à l'aide de balises et de règles que l'on peut personnaliser. Ces balises permettent de structurer de manière hiérarchisée et organisée ces données.
Quelques règles :
- Un document respectant les règles de XML est appelé document bien formé (well-formed).
- L’élément racine doit être unique.
- Il est extrêmement important que les balises ouvrantes et fermantes aient exactement le même nom.
- XML fait la distinction entre les majuscules et les minuscules.
- Toute balise ouverte doit impérativement être fermée.
- Si une balise peut en contenir une autre, il est cependant interdit de les chevaucher.
- Les noms peuvent contenir des lettres, des chiffres ou des caractères spéciaux.
- Les noms ne peuvent pas débuter par un nombre ou un caractère de ponctuation.
- Les noms ne peuvent pas commencer par les lettres XML (quelle que soit la casse).
- Les noms ne peuvent pas contenir d'espaces.
- On évite les caractères , ; . < et >.
- Les règles de nommage sont les mêmes que pour les balises.
- La valeur d'un attribut doit impérativement être délimitée par des guillemets, simples ou doubles.
- Dans une balise, un attribut ne peut être présent qu'une seule fois.
Exercice 1 :
Pour chacun des fichiers suivants, déterminez s'il est bien formé, et corrigez les erreurs :
- Exemple1.xml
- Exemple2.xml
- Exemple3.xml
Exercice 02 : Modélisation XML
Partie 1 : Création d’un fichier livre.xml
Le livre est structuré en sections (au moins 2), en chapitres (au moins 2), et en paragraphes (au moins 2). Le livre doit contenir la liste des auteurs (avec nom et prénom). Tous les éléments doivent posséder un titre, sauf le paragraphe qui contient du texte.
- Proposer une structuration XML de ce document (avec 2 auteurs, 2 sections, 2 chapitres par section et 2 paragraphes par chapitre).
- Vérifiez à l’aide de l’éditeur que votre document est bien formé.
- Attention : Ne pas utiliser d’attributs.
Partie 2 :
On souhaite compléter la structure du document xml de la partie1 par les attributs nom et prénom pour les auteurs et titre pour le livre, les sections et les chapitres.
Analysez la structure du nouveau document. Y a-t-il des simplifications possibles ? Vérifiez à l’aide de l’éditeur que votre document est bien formé.
Exercice 3
Donner une modélisation en xml de la spécification suivante :
Un hôpital est composé de plusieurs services. Chaque service correspond à une spécialité (ophtalmo, pédiatre, orthopédie, ….). Chaque service contient un chef, ensemble de médecin et un ensemble d’infirmiers. Chacune de ces personnages (chef, médecin et infirmier) est décrit par son nom, prénom et sexe.
Exercice 4
Il s'agit de structurer, sous la forme d'un fichier XML, le texte suivant :
Une bouteille d'eau Cristaline de 150 cl contient par litre 71 mg d'ions positifs calcium, et 5,5 mg d'ions positifs magnésium. On y trouve également des ions négatifs comme des chlorures à 20 mg par litre et des nitrates avec 1 mg par litre. Elle est recueillie à St-Cyr la Source, dans le département du Loiret. Son code barre est 3274080005003 et son pH est de 7,45. Comme la bouteille est sale, quelques autres matériaux comme du fer s'y trouvent en suspension. Une seconde bouteille d'eau Cristaline a été, elle, recueillie à la source d'Aurèle dans les Alpes Maritimes. La concentration en ions calcium est de 98 mg/l, et en ions magnésium de 4 mg/l. Il y a 3,6 mg/l d'ions chlorure et 2 mg/l de nitrates, pour un pH de 7,4. Le code barre de cette bouteille de 50 cl est 3268840001008.
Une bouteille de même contenance est de marque Volvic, et a été puisée à... Volvic, bien connu pour ses sources donnant un pH neutre de 7. Elle comprend 11,5 mg/l d'ions calcium, 8,0 mg/l d'ions magnésium, 13,5 mg/l d'ions chlorures et 6,3 mg/l d'ions nitrates. Elle contient également des particules de silice. Son code barre est 3057640117008.
Remarque : Volvic est dans le Puy-de-Dôme (France)...
FAQ
Qu'est-ce qu'un document bien formé en XML ?
Un document bien formé en XML respecte les règles de syntaxe du langage XML, telles que l'élément racine unique, les balises ouvrantes et fermantes correctement nommées, et les balises correctement imbriquées.
Pourquoi XML fait-il la distinction entre les majuscules et les minuscules ?
XML fait la distinction entre les majuscules et les minuscules pour éviter les ambiguïtés et les erreurs de syntaxe. Par exemple, Book et book sont considérés comme des éléments différents.
Quelles sont les règles de nommage pour les balises et les attributs en XML ?
Les noms des balises et des attributs en XML doivent commencer par une lettre ou un caractère de soulignement, et ne peuvent pas contenir d'espaces. Ils ne peuvent pas commencer par les lettres XML (quelle que soit la casse).