Composantes d’une table de dimension

0
262

Composante 1 : surrogate key  ou clé de substitution

La Définition

Une clé de substitution (Surrogate key) est une clé non intelligente utilisée afin de substituer la clé naturelle (Business Key) qui provient des systèmes opérationnels. La clé naturelle est en général composée de plusieurs colonnes.

La clé de substitution ne doit pas être confondue avec la clé artificielle attribuée par les systèmes opérationnels. Du fait qu’il est parfois (voire même souvent) impossible de trouver une clé naturelle pour les entités telles que client, employé, alors on crée une clé artificielle dans le système opérationnel afin d’identifier d’une façon unique un élément de l’entité: client_id pour l’entité client, et emp_id pour l’entité employé. Ces clés artificielles ne doivent pas changer dans le temps pour un client par exemple !

La clé de substitution est alors utilisée dans un entrepôt de données pour remplacer et compléter la clé artificielle du système opérationnel afin de rendre un élément unique dans la dimension.

Les Fonctionnalités

  1. Remplacer la clé naturelle : Effectivement une clé de substitution remplace la clé artificielle en terme d’utilisation, ce n’est plus la clé naturelle qui sera utilisé pour faire les jointures avec les tables de faits ou les autres tables de dimension (niveaux hiérarchiques dans le cas d’une dimension en flocons de neiges);
  2. Complèter l’information :La clé de substitution n’a aucun sens en terme d’affaire, elle est utilisée dans l’entrepôt de données seulement ! et on aura toujours besoin de la clé artificielle ou naturelle dans la dimension pour pouvoir faire la correspondance entre l’élément de dimension (un client par exemple) dans l’entrepôt de données et l’élément de la table des clients dans le système opérationnel.

Les avantages

  1. Performance : Accélère l’accès aux données du moment ou l’on va utiliser un index numérique vu que le type de données de la clé de substitution est numérique.
  2. Indépendance du système source : On ne peut garantir que la clé d’affaire ne change pas dans les systèmes sources.
  3. Historique des changements et granularité infinie : Si l’on désire garder l’historique des changements de la dimension selon certains critères (SCD) nous devons gérer la clé de substitution. Nous nous retrouverons facilement avec plusieurs enregistrements de la même clé d’affaire dans la dimension.

Composantes 2 : attributs

En plus de la clé de substitution et de la clé naturelle, d’autres attributs sont ajoutés à la dimension. Ces attributs sont descriptifs et représente l’information utile sur la dimension (Le salaire d’un employé, l’adresse d’un client…).

Composantes 3: clés spéciales

Chaque table de dimension devrait contenir les colonnes suivantes :

  1. Date effective : c’est la date à la quelle l’enregistrement à été crée, de préférence dans le système d’enregistrements (System of records).
  2. Date retrait : C’est la date à laquelle l’enregistrement a été retiré du système d’enregistrements.
  3. Indicateur effectif : En général est ‘O’ si l’enregistrement est toujours actif (Date retrait non nulle), ‘N’ sinon.

D’autres colonnes peuvent être rajoutées selon le type de l’évolution lente (SCD-Slowly Changing Dimension) que l’on désire implanter. Pour le type 3, une colonne est ajoutée pour contenir la valeur avant le changement