Création de tableau de bord, BI et entrepôt de données

samedi 21 janvier 2012

Organisation des données pour l'exploitation libre par les utilisateurs: le schéma étoile

Dans tout entrepôt de données, le département des TI peut mettre à la disposition des utilisateurs un puissant moyen d'accès aux données: le schéma étoile. Cette approche permet au département TI de se concentrer sur la gestion informatique des données. La création des nombreux rapports peut-être déléguée aux utilisateurs qui y sont très productifs, car ils maîtrisent le domaine d'affaires et leur schéma étoile.

J'ai implanté cette approche dans un ministère qui gère un budget de plusieurs milliards de dollars par année. En quelques semaines, au lieu de plusieurs mois, elle a permis aux utilisateurs de créer par eux-mêmes des dizaines de rapports dans le domaine des ressources financières. En plus, les utilisateurs sont autonomes et n'ont pas à demander au département TI de développer des rapports. Les rapports sont élaborés sur des millions d'enregistrements en ressources financières basés sur le croisement des données des applicatifs Oracle SAGIR (ERP E-Business Suite) et des données du système de mission du client.
 
Vous pouvez aussi tester facilement cette approche dans votre entrepôt de données. Voici les principes de bases.
 
Le schéma étoile est une forme de modélisation ayant deux avantages majeurs: l'accès convivial aux données et la performance. Le schéma étoile est orienté pour les utilisateurs et conçu pour l'exploitation libre des données par l'utilisateur.
 
L'accès convivial aux données se fait via des outils d'exploitation libre pour les utilisateurs comme Cognos 10, OBIEE 11g, Microstrategy, Discoverer Tableau Software ou Business Object. Ces outils possèdent une couche sémantique corporative dans le langage d'affaires du client. Cette composante logicielle est un élément clé de tout entrepôt de données qui permet de traduire le langage informatique en langage d'affaires (et beaucoup d'autres fonctionnalités). En plus, ces outils possèdent des interfaces pour élaborer de rapports mais destinés aux utilisateurs (et non aux programmeurs).
 
Le schéma étoile est convivial pour l'utilisateur puisqu'il repose sur deux structures de tables très simples. La table de faits et les tables de dimensions.
 
La table de fait contient toutes les mesures par domaine d'affaires qui intéressent les utilisateurs pour la création de leurs rapports. Par exemple, le coût d'un produit ou d'un service, le nombre de fois qu'il a été utilisé, des calculs et des moyennes.
 
Les tables de dimensions sont les axes d'analyses utiles pour la création de rapport par l'utilisateur. Par exemple, les clients, les produits et services, les segments de la charte comptable, les dates.
Les dimensions sont simplement rattachées à la table de fait et permettent une analyse multidimensionnelle selon toutes ces dimensions. Il devient donc possible d'analyser les mesures de la table de faits selon diverses combinaisons de dimensions. Par exemple, obtenir les ventes (mesures) par dates (dimension temps), par produits (dimension produit) et par villes (dimension géographique).
 
Il est très important que les dimensions soient partagées et communes à l'ensemble de l'organisation. Les dimensions sont alors conformes et peuvent servir à réaliser des analyses croisées entre les tables de faits des divers domaines de données de l'entrepôt de données. Ainsi l'utilisateur pourra créer des rapports lui permettant de naviguer entre les diverses tables de faits (forage entre les domaines d'affaires).
 
Lorsqu'ils sont bien modélisés, les schémas étoiles sont extrêmement performants, car il minimise le nombre de liens et peuvent être indexés de façon particulière pour la plupart des bases de données comme Oracle.

Aucun commentaire:

Enregistrer un commentaire