Création de tableau de bord, BI et entrepôt de données

dimanche 22 janvier 2012

Test Professionnel BI et entrepôt de données

Voici quelques questions qui vous permettrons de déterminer si vous travailler avec un professionnel qui est capable, d'appliquer et vous de conseiller dans le domaine des entrepôts de données et du BI. Ces questions s'adressent autant à l'architecte BI, au programmeur ou tout autres professionnels BI. Les questions visent à déterminer si les connaissances du professionnelle se limitent à la théorie ou sont incarnées dans la pratique.
1- La couche logique sémantique est une composante clé de l'entrepôt de données à quoi sert-elle ? Nommer au moins deux outils qui ont cette composante.

2- Qu'est ce que le MOLAP ? Quelle est sa principale force ? Quel est sa principale faiblesse ? Nommer au moins deux outils utilisant le MOLAP.

3- Qu'est-ce que le ROLAP ? Quelle est sa principale force ? Quel est sa principale faiblesse ? Nommer au moins deux outils utilisant le ROLAP.

4- Qu'est-ce qu'une dimension ? De quoi est-elle composée ?

5- Qu'est qu'une dimension conforme ? Pourquoi sont-elles obligatoires dans un entrepôt de donnée ?

6- Qu'est-ce qu'une table de fait ? De quoi est-elle composée ?

7- Nommer au moins deux outils d'exploitation libre BI avec lesquels l'utilisateur peut créer ses rapports sans l'intervention de programmeur.

8- Qu'est-ce que le staging ? À qui est-il destiné ?

9- Qu'est-ce qu'un schéma étoile ? À qui est-il destiné ? Nommer deux de ces caractéristiques utilisateurs.

10- Qu'est ce que l'ETL ? Nommer deux outils ETL.

Chacune des questions vaut 10 points Vous pouvez donc évaluer votre spécialiste sur 100. Étant données que ce sont des questions vraiment fondamentales la note de passage est de 75%.

Pour une correction vous pouvez m'écrire.

François Bouffard
Architecte BI et analyste d'affaires BI
PanoramaTechnologies.com

samedi 21 janvier 2012

Organisation des données pour l'exploitation libre par les utilisateurs: le schéma étoile

Dans tout entrepôt de données, le département des TI peut mettre à la disposition des utilisateurs un puissant moyen d'accès aux données: le schéma étoile. Cette approche permet au département TI de se concentrer sur la gestion informatique des données. La création des nombreux rapports peut-être déléguée aux utilisateurs qui y sont très productifs, car ils maîtrisent le domaine d'affaires et leur schéma étoile.

J'ai implanté cette approche dans un ministère qui gère un budget de plusieurs milliards de dollars par année. En quelques semaines, au lieu de plusieurs mois, elle a permis aux utilisateurs de créer par eux-mêmes des dizaines de rapports dans le domaine des ressources financières. En plus, les utilisateurs sont autonomes et n'ont pas à demander au département TI de développer des rapports. Les rapports sont élaborés sur des millions d'enregistrements en ressources financières basés sur le croisement des données des applicatifs Oracle SAGIR (ERP E-Business Suite) et des données du système de mission du client.
 
Vous pouvez aussi tester facilement cette approche dans votre entrepôt de données. Voici les principes de bases.
 
Le schéma étoile est une forme de modélisation ayant deux avantages majeurs: l'accès convivial aux données et la performance. Le schéma étoile est orienté pour les utilisateurs et conçu pour l'exploitation libre des données par l'utilisateur.
 
L'accès convivial aux données se fait via des outils d'exploitation libre pour les utilisateurs comme Cognos 10, OBIEE 11g, Microstrategy, Discoverer Tableau Software ou Business Object. Ces outils possèdent une couche sémantique corporative dans le langage d'affaires du client. Cette composante logicielle est un élément clé de tout entrepôt de données qui permet de traduire le langage informatique en langage d'affaires (et beaucoup d'autres fonctionnalités). En plus, ces outils possèdent des interfaces pour élaborer de rapports mais destinés aux utilisateurs (et non aux programmeurs).
 
Le schéma étoile est convivial pour l'utilisateur puisqu'il repose sur deux structures de tables très simples. La table de faits et les tables de dimensions.
 
La table de fait contient toutes les mesures par domaine d'affaires qui intéressent les utilisateurs pour la création de leurs rapports. Par exemple, le coût d'un produit ou d'un service, le nombre de fois qu'il a été utilisé, des calculs et des moyennes.
 
Les tables de dimensions sont les axes d'analyses utiles pour la création de rapport par l'utilisateur. Par exemple, les clients, les produits et services, les segments de la charte comptable, les dates.
Les dimensions sont simplement rattachées à la table de fait et permettent une analyse multidimensionnelle selon toutes ces dimensions. Il devient donc possible d'analyser les mesures de la table de faits selon diverses combinaisons de dimensions. Par exemple, obtenir les ventes (mesures) par dates (dimension temps), par produits (dimension produit) et par villes (dimension géographique).
 
Il est très important que les dimensions soient partagées et communes à l'ensemble de l'organisation. Les dimensions sont alors conformes et peuvent servir à réaliser des analyses croisées entre les tables de faits des divers domaines de données de l'entrepôt de données. Ainsi l'utilisateur pourra créer des rapports lui permettant de naviguer entre les diverses tables de faits (forage entre les domaines d'affaires).
 
Lorsqu'ils sont bien modélisés, les schémas étoiles sont extrêmement performants, car il minimise le nombre de liens et peuvent être indexés de façon particulière pour la plupart des bases de données comme Oracle.