Cours Modélisation dimensionnelle Faits et table de faits

Ce document contient une introduction à la modélisation dimensionnelle, destinée aux étudiants universitaires. Il couvre les notions suivantes:

  • Les tables de faits et leurs caractéristiques
  • Les dimensions et leurs attributs
  • Les modèles multidimensionnels : étoile, flocon de neige et constellation

Modélisation dimensionnelle Faits et table de faits

Télécharger PDF

Modélisation dimensionnelle

Faits et table de faits

Une table de fait est une table qui contient les données observables (les faits) que l'on possède sur un sujet et que l'on veut étudier, selon divers axes d'analyse (les dimensions).

Les « faits », dans un entrepôt de données, sont normalement numériques, puisque d'ordre quantitatif. Il peut s'agir du chiffre d’affaire (montant en argent des ventes), du nombre d'unités vendues d'un produit, etc.

Une table de faits représente une association entre plusieurs tables de dimensions, elle doit donc respecter le principe d’intégrité référentielle.

Une table de faits se présente généralement comme suit :

  • Clés étrangères vers les dimensions
  • Dimensions dégénérées
  • Mesures

Table de Fait

  • id_dim1 (FK)
  • id_dim2 (FK)
  • ...
  • id_dim n (FK)
  • Code_dim dég1 (DD)
  • Code_dim dég2 (DD)
  • ...
  • Code_dim dég m (DD)
  • Mesure 1
  • Mesure 2
  • ...

Clé primaire (PK)

Caractéristiques d’une table de faits

  • Une table de faits contient les valeurs numériques de ce qu’on désire mesurer.
  • Une table de fait contient les clés associées aux dimensions. Il s’agit de clés étrangères vers les dimensions.
  • Une table de fait contient plus d’enregistrements qu’une table de dimension.
  • Les mesures (Mesure1, Mesure2 … Mesure n) doivent référer et avoir un lien direct avec les clés des dimensions (Id_dim1, Id_Dim2 ... Id_Dimn).

Exemple de table de fait : Table T_CA

Dimension

Une dimension est une table qui représente un axe d'analyse selon lequel on veut étudier des données observables (les faits) qui, soumises à une analyse multidimensionnelle, donnent aux utilisateurs des renseignements nécessaires à la prise de décision.

On appelle donc « dimension » un axe d'analyse. Il peut s'agir des clients ou des produits d'une entreprise, d'une période de temps comme un exercice financier, des activités menées au sein d'une société, etc.

Clés de substitution (Surrogate key)

Dimension

Clé primaire (PK)

Clé naturelle (NK)

Attribut 1

Attribut 2

...

Attribut n

Clé d’affaire (business key ou Natural key)

Attributs de la dimension

Caractéristiques d’une dimension

  • Une table de dimension contient le détail sur les faits.
  • Une table de dimension contient les informations descriptives des valeurs numériques de la table de faits.
  • Une table de dimension contient en général beaucoup moins d’enregistrements qu’une table de faits.
  • Les attributs d’une table de dimension sont souvent utilisés comme « Tête de lignes » et « Tête de colonne » dans un rapport ou résultat de requête.

Modélisation multidimensionnelle

Il existe 3 formes de modèles multidimensionnels :

  • Le modèle en étoile (Star schema)
  • Le modèle en flocon de neige (Snowflake schema)
  • Le modèle en constellation (Factflake schema)

Modèle en étoile

Une table de faits : identifiants des tables de dimension avec une/plusieurs mesures.

Plusieurs tables de dimension.

Absence d’hiérarchies au niveau des dimensions.

Avantages

  • Facilité de navigation.
  • Performances : nombre de jointures limité.

Inconvénients

  • Dimensions dé-normalisées (non en 3 FN).
  • Redondances dans les dimensions.

Exemple de Redondance dans la Dim TIMES

Modèle en flocons

Pour rendre simple la lecture du modèle, on regroupe certaines dimensions, on définit alors des hiérarchies.

Modèle en flocons de neige

Modèle en étoile + normalisation des dimensions.

Lorsque les tables sont trop volumineuses.

Avantages

  • Réduction du volume.
  • Permettre des analyses par pallier (drill down/Roll up) sur la dimension hiérarchisée.

Inconvénients

  • Navigation difficile.
  • Nombreuses jointures.

Le modèle en constellation (Fact-flake)

La modélisation en constellation consiste à fusionner plusieurs modèles en étoile qui peuvent utiliser des dimensions communes.

Un modèle en constellation comprend donc plusieurs tables de faits et des tables de dimensions communes ou non à ces tables de faits.

FAQ

Qu'est-ce qu'une table de faits ?

Une table de fait est une table qui contient les données observables (les faits) que l'on possède sur un sujet et que l'on veut étudier, selon divers axes d'analyse (les dimensions).

Qu'est-ce qu'une dimension ?

Une dimension est une table qui représente un axe d'analyse selon lequel on veut étudier des données observables (les faits) qui, soumises à une analyse multidimensionnelle, donnent aux utilisateurs des renseignements nécessaires à la prise de décision.

Quels sont les avantages du modèle en étoile ?

Les avantages du modèle en étoile incluent la facilité de navigation et les performances grâce au nombre limité de jointures.

Partagez vos remarques, questions , propositions d'amélioration ou d'autres cours à ajouter dans notre site

Enregistrer un commentaire (0)
Plus récente Plus ancienne

Publicité 1

Publicité 2