De futurs experts @Pentaho #BigData lors de notre BDI Paris Merci à tous http://t.co/pa59pk8psc
Archives pour la catégorie BigData
Pentaho 2015
Au delà de cette invitation au prochain Pentaho World ce mois d’octobre 2015 à Orlando, une envie de vous informer de ce que je considère comme de bonnes nouvelles.
Comme vous pouvez le constater, Pentaho se focalise sur l’analyse des Big Data et de l’analyse embarquée. Ces prochains mois, à travers notre version 5.4 et notre majeure de l’année la v6.0 de cet automne , vous découvrirez une nouvelle génération de concepts.
Comme évoqué sur de nombreux blogs, le Big Data n’est vraiment plus réservé qu’aux grandes entreprises. Très souvent elles transforment cela en un projet d’infrastructure alors que comme tout l’IT l’important est le temps gagné et la simplicité. Oui j’ai bien dit la simplicité!
Aujourd’hui vous prenez du temps à modéliser, et je ne vous dirais pas que ce n’est pas important, mais désormais vous pouvez modéliser autant de fois que vous le souhaitez. Une erreur détectée après quelques semaines? Rien de grave, avec les solutions NoSql, enrichissez votre modèle au rythme de vos besoins. Avec Hadoop régénérer vos outputs à votre envie. Ne vous relancez pas dans un cycle long d’interface de rechargement!
Cet ODS que vous ne respectiez pas toujours est désormais natif à travers les solutions Big Data qui vous offre un Data Lake quasi sans limite, permanent et auto sécurisé.
Alors là oui vous travaillerez main dans la main avec votre administrateur Hadoop de l’équipe Infra pour le convaincre d’ajouter des Nodes. En fait il aura déjà anticipé cette action sans avoir à se préoccuper des projets impactés.
Pentaho vous permet d’utiliser tous ces outils simplement à travers le plus que génial Pentaho Data Integration. Vous le découvrirez bientôt encore plus joli! et encore plus simple à Clusteriser pour dispatcher vos traitements sur différents serveurs ou paralléliser une action massive.
Alors vous serez en mesure avec Analyzer de proposer une interface à vos analystes. Vous pourrez customiser votre console comme autant d’applications souhaitées.
Why not un projet = une console… mais chacun partageant les mêmes Metadata sécurisées si vous le souhaitez.
Bien entendu nos API de plus en plus riches, vous permettent également de positionner vos meilleures analyses directement dans l’application métier de vos utilisateurs facilitant la conduite du changement.
Car changement oui il en a un. Vous le percevez tous dans votre vie quotidienne et l’AppleWatch, que je ne n’adore pas, utilise un concept qui lui a de beaux lendemains. C’est ce que l’on appelle l’internet des objets. Une nouvelle étape qui comme toutes celles que nous vivons en ce moment va se déployer comme une traînée de poudre. C’est pourquoi Hitachi Data System est un excellent choix pour nous. L’infrastructure et le logiciel d’analyse de données. Ce mix permettra à Pentaho de bénéficier d’encore plus de moyens sans renier son ADN open-source.
Car Oui, vu que la liste des invités au jeu de l’analyse de données s’élargie (tous les constructeurs d’objets!) il n’a jamais été aussi important de partager au delà des standards des objets ouverts facilitant les interconnexions.
Ne remettez pas en cause votre architecture BI, optimisez la! Encapsulez-la à l’image du Cloud et des Big Data et comme toujours concentrez-vous sur les datas 😉
Seb @opentoile
Streamline Data Refinery
Dans un environnement Big Data la réplication des données peut être lourde de conséquence. Aussi il est nécessaire de pouvoir exploiter les données directement depuis leurs sources et de produire des solutions d’analyses à vos « clients ».
Le concept de « Streamline Data Refinery » de Pentaho répond à ces besoins. Nous vous proposons en effet de préparer à l’avance des interfaces pouvant accéder facilement à telle ou telle information représentant un indicateur ou des axes d’analyses innovants.
L’utilisateur pourra ainsi sélectionner librement à travers un formulaire les informations qu’ils souhaitent analyser ponctuellement. Celles-ci seront combinées ensemble par la génération d’un schéma d’analyse Mondrian, et automatiquement publiées sur l’écran de l’utilisateur à travers notre outil Ad’Hoc Pentaho Analyzer.
On parle donc bien là de proposer à l’utilisateur de générer un cuble Olap d’analyse à la demande!
Bien entendu les données proposées peuvent avoir plusieurs sources distinctes (DWH, Fichiers HDFS, NoSql, …) .
Data Lake on demand
Spine Planes concept for your DataCenter
Very interesting to read these concepts of « Spine planes » and « Server Pods » code.facebook.com/posts/36034627…
Worldometers as WorldData
Worldometers worldometers.info/fr/#.VHIFkaoLO… How to say? Big Data… No World Data!
Very interesting to get read these KPIs about our planet!
But disappointed that there is no Web Services to consume it from outside !
Dashboard MongoDB & Pentaho
Vous avez succombé aux charmes de MongoDB ?
Vous aimeriez bien visualiser vos données aisément ?
Voici un exemple de Dashboard réalisé en 20min sans compter la création des collections Mongo
MAIS SANS DEPLACER LES DONNEES
Tout s’affiche directement depuis votre base magique = MongoDB+Pentaho!
I’m on the Map !
Le point indiquant Marseille
représente mes tweets signés
opentoile 😉
PentahoWorld2014 en images
Great pictures, thanks for sharing
RT @it4bizbrazil: I posted 102 photos on Facebook in the album « #PWorld14 » fb.me/3kmTtvBq6«
Définition de « Big Data »
Vous cherchez la définition de « Big Data » ?
= Toutes vos données
Pentaho a la réponse « All your Data » #PWorld2014
——- PETITE HISTOIRE DE L’ANALYSE DES DONNÉES ——–
- On a commencé par ajouter des codes analytiques dans les ERP comptable
- On a ajouté derrière de beaux Datawarehouse et des outils de reporting
- On s’est concentré sur les services ayant de l’argent = La finance
- On a frustré les autres services
- On s’est dit on va étendre le périmètre!
- Ah mince tous les services ne bénéficient pas de code analytiques référencés dans l’ERP!
- Ah mince ça coûte cher d’étendre le Datawarehouse
- On nous a dit qu’il y avait des Appliances pour cela
- Euh en fait on l’a dit qu’aux grosses compagnies car les autres étaient censés ne pas être intéressés ou ne pas avoir le budget adéquat
- Euh en fait ils ne peuvent traiter que ce qui est déjà dans votre ERP
- Les spécialistes des réseaux sociaux (Facebook & Co …) n’y trouvaient pas leur compte
- Ces nouveaux géants ont donc travailler sur des projets OpenSource
- Ils ont crées ce que l’on nomme aujourd’hui le BIG DATA
- Les spécialistes de l’analyse de données OpenSource ont été des acteurs privilégiés pour adapter leurs solutions à ces nouveaux éco-systèmes
- Certains ont focalisés seulement sur le collaboratif, le InMemory, …
- Mais les besoins des utilisateurs n’ont pas changés, ce qu’ils veulent c’est pouvoir analyser toutes leurs données
- C’est pourquoi aujourd’hui Pentaho propose le concept de RAFFINERIE DE DONNEES
- Stockage = Hadoop et/ou NoSql
- Economique et puissant (ScaleUp / ScaleDown)
- Un dynamisme OpenSource ultra dynamique laissant les timides à la traine
- Sélection de vos thématiques de recherche = Pentaho Stream Data Refinery
- Une véritable interface Web à la « Google » pour identifier vos besoins
- Un moyen pour tous de rechercher les données qui les interesse
- Préparation et modélisation de vos données = Pentaho Data Integration
- Lecture en directe des données utiles depuis Hadoop
- Stockage en mode décisionnel dans une base analytique de votre choix (Attention je parle de vraie base en colonne et pas d’un énième système propriétaire qui doit pré-calculer ses index magiques)
- Visualisation de vos données avec Pentaho Analyzer OU directement dans votre application préférée
- Une interface Web 100%HTML5 utilisable par votre assistante si vraiment vous êtes frileux mais je dirai que l’on est jamais mieux servi que par soi-même (Après tout vous avez bien réussi à vous servir d’Excel!)
- Vous utilisez majoritairement une application dans votre entreprise?, alors embarquons Pentaho Analyzer directement dans votre applicatioon préférée
- Stockage = Hadoop et/ou NoSql
TOUTES LES DONNÉES pour TOUS LES UTILISATEURS (pas de licence nommée!)
IBM propose son Pentaho Data science Pack!
IBM entend mettre la puissance de l’analytique à la portée de tous : itchannel.info/articles/15055…
C’est joliment présenté, c’est certainement cher, c’est bien foutu j’imagine MAIS chez Pentaho on vous propose le Data Science Pack qui vous ruinera beaucoup moins et vous apportera le même ROI
Aider les DataScientist à travailler main dans la main avec le business !
http://c.brightcove.com/services/viewer/federated_f9?isVid=1&isUI=1
Done, Analytic hope, Data available
Au moins pour le graphique qui défini bien notre cible.
So true RT @jmichel_franco: Too much talk in Analytics & too little action! flip.it/9qu85 via @BenKerschberg