Ce document intitulé "Systèmes décisionnels et Entrepôts de données" est destiné aux étudiants universitaires. Il couvre les notions suivantes:
- Modélisation conceptuelle d'un magasin de données pour analyser les chiffres d'affaires et les quantités vendues.
- Modélisation logique et physique des entrepôts de données.
- Étude de cas sur la création d'un entrepôt de données pour une banque distribuant des cartes de paiement.
Exercices TD Systèmes décisionnels et Entrepôts de données
Télécharger PDFSystèmes décisionnels et Entrepôts de données
Soit le schéma relationnel suivant:
- Client (NCL, NomCl, DN, Code Ville*)
- Ville (Code Ville, Nom Ville, CodePays*)
- Pays (CodePays, NomPays)
- Produit (NP, NomP, PrixUnitaire, CodeCategorie*)
- Categorie(CodeCategorie, NomCategorie)
- Commande (NumC, DateC, NCL*)
- LigneCom (NumC*, NP*, Qte)
On veut construire un magasin de données à partir de cette source de donnée, permettant d'analyser les chiffres d'affaire réalisés ainsi que les quantités vendues.
Travail à réaliser :
- Modélisation conceptuelle de ce magasin de données.
- Modélisation logique : proposer une spécification R-OLAP dénormalisée de ce magasin de données.
- Modélisation physique: donner la listes des commandes ORACLE permettant de créer les tables de fait et de dimensions sous forme de vues materialisées.
TD 2
Enoncé
Une banque distribue une carte de paiement («< carte de crédit ») à ses clients. Elle décide de réaliser un entrepôt de données afin de faire le suivi des paiements suivants effectués avec la carte:
- voyages en avion,
- locations de voiture,
- hôtellerie.
A chaque déplacement en avion, la compagnie aérienne lui envoie un fichier contenant les éléments suivants : identification de la carte de paiement, coordonnées du client et de la compagnie aérienne; ville de départ, ville d'arrivée, n° du vol, date du vol, n° du billet, classe du siège, distance parcourue, date d'achat et prix payé. Pour simplifier, on supposera qu'un voyage en avion se réduit à un vol (voyage aller effectué dans la même journée, pas de correspondances), et que le client voyage seul. Les loueurs de véhicule transmettent après chaque location: identification de la carte de paiement, coordonnées du client et de la société de location de véhicules; catégorie du véhicule, date de début de location, date de fin de location, nombre de jours, distance parcourue, date de réservation et prix payé.
L'hôtel transmet à chaque séjour : identification de la carte de paiement, coordonnées du client et de l'hôtel: catégorie de chambre, date de début de séjour, date de fin de séjour, nombre de nuitées, date de réservation, prix de l'hébergement et prix de la restauration.
Questions
- Un premier magasin de données (MD) ne concerne que les déplacements en avion. Etablir le modèle dimensionnel conceptuel. Faire clairement apparaître les dimensions et les indicateurs. Cet MD doit permettre de répondre aux questions suivantes : quel est le chiffre d'affaires (CA) par client, par date de voyage (et par mois, trimestre et année), par compagnie aérienne, par ville de destination ? Les tableaux de bord doivent pouvoir présenter les totaux et sous totaux de CA: tous clients confondus, et/ou toutes dates, et/ou toutes compagnies, et/ou toutes destinations.
- De même, établir deux autres modèles dimensionnels, fun pour les locations de voiture, l'autre pour l'hôtellerie. Dans le cas de la location de voiture, on souhaite éditer le CA, le nombre de jours de location, et le kilométrage pour chaque client, date de réservation, ville, loueur, et catégorie de véhicule, ainsi que toutes les sommations de la même manière que pour les déplacements. Dans le cas de l'hôtellerie, on veut des tableaux de bord par client, hôtel, ville, date de début de séjour, catégorie de véhicule, faisant apparaître le nombre de nuitées, le prix total payé et le ratio << prix de l'hébergement / prix de la restauration >>.
- Modélisation logique proposer une spécification R-OLAP normalisée de ces magasins de données.
FAQ
Qu'est-ce qu'un entrepôt de données ?
Un entrepôt de données est une base de données centralisée qui stocke des données intégrées provenant de différentes sources. Il est conçu pour faciliter l'analyse et la prise de décision en fournissant une vue consolidée et historique des données.
Quelle est la différence entre un fait et une dimension dans un modèle de données ?
Un fait est une mesure quantitative, comme le chiffre d'affaires ou le nombre de ventes. Une dimension est une catégorie de données qui permet de décomposer les faits, comme la date, le client ou le produit.
Pourquoi utiliser des vues materialisées dans un entrepôt de données ?
Les vues materialisées sont utilisées pour améliorer les performances des requêtes en pré-calculant et stockant les résultats de requêtes complexes. Cela permet de réduire le temps de réponse des requêtes fréquentes.