Monitoring Nifi via streaming de bulletin dans Hive 3
Contexte Dans le cadre du suivi de production et le monitoring Nifi, je vais vous présenter un moyen que nous utilisons pour sauvegarder l’ensemble des évènements « bulletin » au sein d’un cluster Nifi. Après avoir évoqué les enjeux, je vous présenterai l’implémentation technique ainsi qu’une alternative avec Impala. Composants utilisés CDP Private Cloud 7.1.2 …
Continuer la lecture de « Monitoring Nifi via streaming de bulletin dans Hive 3 »
Architecture Druid
Apache Druid est une base de données analytique axé temps réel offrant la possibilité de persister des quantités de données immenses et d’en extraire de l’information à une vitesse hallucinante, le tout couvrant de nombreux use cases, Druid aurait donc tout pour plaire. Creusons l’architecture d’apache Druid ensemble. La dernière version stable de Druid est …
Surdimensionnement de l’infrastructure : un facteur contre-productif en Big Data et Datascience
Dans le Big Data, la tendance dans les entreprises est de se concentrer sur les aspects d’analyse de la donnée, sans beaucoup se préoccuper du « moteur ». Pourtant, l’infrastructure est un élément tout à fait essentiel pour qui entend réussir sur le long terme.
La Cloudera Data Platform va plaire, mais à quel prix ?
Cloudera a depuis quelques mois sorti sa nouvelle plateforme Cloud native : Cloudera Data Platform. Elle se décline en plusieurs parties : de la gouvernance via SDX, une partie Cloud, piloté par Cloudera et déployable sur AWS et Azure (bientôt GCP) et enfin une partie hébergeable sur des serveurs chez soi avec une possibilité d’hybridation, possédant des capacités de déport de calcul dans un environnement conteneurisé Openshift.
Attention ! Les conteneurs sont à l’honneur pour ces offres attractives mais attention aux coûts cachés. Passons en revue ces différentes offres pour y voir plus clair
GitLab version 13.5, quoi de neuf ?
La collaboration entre les utilisateurs est l’une des valeurs fondamentales de GitLab, et l’un des éléments clé du DevOps. Ce mois-ci, GitLab propose pas moins de 60 améliorations, dont plusieurs fonctionnalités destinées à la collaboration entre votre équipe, vos outils et vos pairs.
GitLab version 13.4, quoi de neuf ?
Sortie le 22 septembre dernier, la dernière version de GitLab apporte son lot de nouveautés pour réduire les risques et accroître l’efficacité des équipes, améliorer l’expérience utilisateur et accélérer la CI/CD.
Python 3.9, tour d’horizon et nouveautés
Python 3.9, tour d’horizon Python 3.9 vient d’être annoncé le 6 Octobre 2020. Cette version amène plusieurs fonctionnalités très prometteuses. Corrige des bugs et se positionne par rapport à l’avenir du langage. A Cyrès, nous constatons une augmentation des développements Python, que ce soit dans le domaine du Big Data, des containeurs ou DevOps, Des …
Continuer la lecture de « Python 3.9, tour d’horizon et nouveautés »
JupyterHub vs CDSW, comparatif : quelle solution choisir ?
Avec la hausse des données à analyser et du besoin en Big Data, les Data Scientists ont de plus en plus besoin d’outils et plateformes répondant à leurs besoins tels que la suite Jupyter (JupyterHub) et Cloudera Data Science Workbench (CDSW).
L’évolution prometteuse de Spark 3.0
Novembre 2019, alors que je continuais à préparer ma présentation sur Spark en interne pour présenter cette technologie à mes collègues, j’ai été agréablement surpris de voir que Spark 3.0 a été annoncé en preview. Au fil des années, Spark a su s’imposer en tant que technologie majeur au niveau du data processing, et cette annonce appuie ce fait, de nombreuses nouveautés et changements ont été annoncés, ceci se traduisant par plus de 3000 tickets Jira, ce qui est énorme !
Comment utiliser son budget innovation en tant que grand groupe ?
Yohann Berhouc, Directeur Général de Cyrès a donné son point de vue en juin dernier sur la manière dont les grands groupes utilisent leur budget innovation au travers les différents départements qui les composent. Comment se constitue un budget innovation, comment les DSI s’organisent-elles en fonction de celui-ci, quels sont les objectifs de développement qui y sont associés. Des thèmes traités dans cet avis d’expert, publié initialement chez ZDnet.fr et Docaufutur.fr.