Modélisation dimensionnelle

0
493

La définition

La modélisation multidimensionnelle été introduite par Ralph Kimball.  Elle consiste en deux nouveaux concepts tels que les faits et les dimensions.

Chaque modèle multidimensionnel est composé d’une table  des faits qui permettent de mesurer l’activité et d’un ensemble de tables dimensionnelles qui contiennent les informations contextuelles faisant varier les mesures de l’activité en question.Chaque table de faits possède une clé qui la relie avec la clé primaire de chaque table de dimension.

Selon l’architecture de Ralph Kimball (Back Room et Front Room), les structures de données dimensionnelles sont la destination ultime des processus ETL et ces tables se positionnent à la frontière entre le Back Room et le Front Room. En général les tables dimensionnelles sont l’étape finale de stockage physique de données avant leur transfert vers l’environnement des utilisateurs finaux.

Le modèle dimensionnel est la structure de données la plus utilisée et la plus appropriée aux requêtes et analyses des utilisateurs d’entrepôts de données. Elles sont simples à créer, stables et intuitivement compréhensibles par les utilisateurs finaux. Le modèle dimensionnel est la fondation même pour la construction des cubes OLAP. Il consiste en une grande table de faits ( fact table) et un cercle d’autres tables qui contiennent les éléments descriptifs du fait, appelées « dimensions ». Quand illustré, le modèle ressemble à une étoile, c’est d’ailleurs l’origine du terme « En étoile ».

Les Quatres étapes de la modélisation dimensionnelle

Pour bien réussir le modèle dimensionnel il est nécessaire de réaliser les quatre étapes suivantes :

  1. Choisir le Processus à Modéliser : Il s’agit de choisir le processus d’affaire à étudier. Un processus une séries d’activités qui transforment des intrants en extrants en y ajoutant de la valeur et ce en faisant appel à différentes ressources humaines, matérielles et financières. Le choix du processus est en général effectué par les utilisateurs finaux ( Un logigramme ou cartographie devrait exister pour documenter le processus d’affaire en question). D’ailleurs c’est à ce stade que l’on essaye de traduire les objectifs des scorecards en KPI dans le cas des DSS d’indicateurs de gestion…
  2. Définir la granularité du processus : Il s’agit de répondre à la question : Que représente un enregistrement de la table de fait ? La granularité définit le niveau de détail contenu dans la table de fait. Voici quelques exemples : Une ligne de commande par produit, par client et par jour. Une transaction bancaire par client par type de retrait et par mois. Il s’agit de l’étape la plus critique lors de la création du modèle.
  3. Choisir les Dimensions : Dans cette étape on doit choisir les différentes dimensions qui représentent le contexte dans lequel le fait a eu lieu. Il est donc question de définir les axes d’analyse.
  4. Identifier les Faits : Pour identifier les faits, il faut répondre à la question : Qu’est ce qu’on mesure ? On peut mesurer le nombre de clients qui ont acheté le Produit P, le jour J, au magasin « M ».