Vous cherchez la définition de « Big Data » ?
= Toutes vos données
Pentaho a la réponse « All your Data » #PWorld2014
——- PETITE HISTOIRE DE L’ANALYSE DES DONNÉES ——–
- On a commencé par ajouter des codes analytiques dans les ERP comptable
- On a ajouté derrière de beaux Datawarehouse et des outils de reporting
- On s’est concentré sur les services ayant de l’argent = La finance
- On a frustré les autres services
- On s’est dit on va étendre le périmètre!
- Ah mince tous les services ne bénéficient pas de code analytiques référencés dans l’ERP!
- Ah mince ça coûte cher d’étendre le Datawarehouse
- On nous a dit qu’il y avait des Appliances pour cela
- Euh en fait on l’a dit qu’aux grosses compagnies car les autres étaient censés ne pas être intéressés ou ne pas avoir le budget adéquat
- Euh en fait ils ne peuvent traiter que ce qui est déjà dans votre ERP
- Les spécialistes des réseaux sociaux (Facebook & Co …) n’y trouvaient pas leur compte
- Ces nouveaux géants ont donc travailler sur des projets OpenSource
- Ils ont crées ce que l’on nomme aujourd’hui le BIG DATA
- Les spécialistes de l’analyse de données OpenSource ont été des acteurs privilégiés pour adapter leurs solutions à ces nouveaux éco-systèmes
- Certains ont focalisés seulement sur le collaboratif, le InMemory, …
- Mais les besoins des utilisateurs n’ont pas changés, ce qu’ils veulent c’est pouvoir analyser toutes leurs données
- C’est pourquoi aujourd’hui Pentaho propose le concept de RAFFINERIE DE DONNEES
- Stockage = Hadoop et/ou NoSql
- Economique et puissant (ScaleUp / ScaleDown)
- Un dynamisme OpenSource ultra dynamique laissant les timides à la traine
- Sélection de vos thématiques de recherche = Pentaho Stream Data Refinery
- Une véritable interface Web à la « Google » pour identifier vos besoins
- Un moyen pour tous de rechercher les données qui les interesse
- Préparation et modélisation de vos données = Pentaho Data Integration
- Lecture en directe des données utiles depuis Hadoop
- Stockage en mode décisionnel dans une base analytique de votre choix (Attention je parle de vraie base en colonne et pas d’un énième système propriétaire qui doit pré-calculer ses index magiques)
- Visualisation de vos données avec Pentaho Analyzer OU directement dans votre application préférée
- Une interface Web 100%HTML5 utilisable par votre assistante si vraiment vous êtes frileux mais je dirai que l’on est jamais mieux servi que par soi-même (Après tout vous avez bien réussi à vous servir d’Excel!)
- Vous utilisez majoritairement une application dans votre entreprise?, alors embarquons Pentaho Analyzer directement dans votre applicatioon préférée
- Stockage = Hadoop et/ou NoSql
TOUTES LES DONNÉES pour TOUS LES UTILISATEURS (pas de licence nommée!)