Category: Big Data

Spark 3 : Adaptive Query Execution, explication et optimisation

Spark 3 : Adaptive Query Execution, explication et optimisation

Publié le Modifié le

  J’ai assisté à un webinar Cloudera sur le tuning des performances d’applications Spark proposé par François Reynald, un des Senior Technical Instructor de Cloudera, il a d’ailleurs écrit cet article sur comment Spark 3 améliore les performances des SQL workloads. Et dans l’un des précédents articles du blog Cyrès, j’avais évoqué les principales nouveautés …

Lire la suite

Cas d’usage Nifi : pagination REST, Jolt et monitoring

Cas d’usage Nifi : pagination REST, Jolt et monitoring

Publié le Modifié le

Contexte Chez Cyrès, nous gérons la saisie des temps via un outil pratique et puissant : Toggl. Dans le cadre de l’amélioration du reporting, m’est venu l’idée d’intégrer les rapports CSV de cet outil, au sein de notre plateforme interne Cloudera. L’objectif de ce cas d’usage Nifi étant de pouvoir faire gagner du temps aux …

Lire la suite

Gouvernance des données : CDP et Ranger, le Data Masking simplement

Gouvernance des données : CDP et Ranger, le Data Masking simplement

Publié le Modifié le

Introduction Que vos bases de données contiennent des données sensibles liées au bancaire, à la santé, aux données personnelles d’utilisateurs ou que vous ayez simplement à cœur de mettre en place une bonne gouvernance des données, vous allez sans doute devoir anonymiser vos données. Le data masking est une pratique qui peut être difficile à …

Lire la suite

Monitoring Nifi via streaming de bulletin dans Hive 3

Monitoring Nifi via streaming de bulletin dans Hive 3

Publié le Modifié le

Contexte Dans le cadre du suivi de production et le monitoring Nifi, je vais vous présenter un moyen que nous utilisons pour sauvegarder l’ensemble des évènements « bulletin » au sein d’un cluster Nifi. Après avoir évoqué les enjeux, je vous présenterai l’implémentation technique ainsi qu’une alternative avec Impala. Composants utilisés CDP Private Cloud 7.1.2 …

Lire la suite

Architecture Druid

Architecture Druid

Publié le Modifié le

Apache Druid est une base de données analytique axé temps réel offrant la possibilité de persister des quantités de données immenses et d’en extraire de l’information à une vitesse hallucinante, le tout couvrant de nombreux use cases, Druid aurait donc tout pour plaire. Creusons l’architecture d’apache Druid ensemble. La dernière version stable de Druid est …

Lire la suite

La Cloudera Data Platform va plaire, mais à quel prix ?

La Cloudera Data Platform va plaire, mais à quel prix ?

Publié le Modifié le

Cloudera a depuis quelques mois sorti sa nouvelle plateforme Cloud native : Cloudera Data Platform. Elle se décline en plusieurs parties : de la gouvernance via SDX, une partie Cloud, piloté par Cloudera et déployable sur AWS et Azure (bientôt GCP) et enfin une partie hébergeable sur des serveurs chez soi avec une possibilité d’hybridation, possédant des capacités de déport de calcul dans un environnement conteneurisé Openshift.
Attention ! Les conteneurs sont à l’honneur pour ces offres attractives mais attention aux coûts cachés. Passons en revue ces différentes offres pour y voir plus clair

Lire la suite

GitLab version 13.5, quoi de neuf ?

GitLab version 13.5, quoi de neuf ?

Publié le Modifié le

La collaboration entre les utilisateurs est l’une des valeurs fondamentales de GitLab, et l’un des éléments clé du DevOps. Ce mois-ci, GitLab propose pas moins de 60 améliorations, dont plusieurs fonctionnalités destinées à la collaboration entre votre équipe, vos outils et vos pairs.

Lire la suite

GitLab version 13.4, quoi de neuf ?

GitLab version 13.4, quoi de neuf ?

Publié le Modifié le

Sortie le 22 septembre dernier, la dernière version de GitLab apporte son lot de nouveautés pour réduire les risques et accroître l’efficacité des équipes, améliorer l’expérience utilisateur et accélérer la CI/CD.

Lire la suite

Python 3.9, tour d’horizon et nouveautés

Python 3.9, tour d’horizon et nouveautés

Publié le Modifié le

Python 3.9, tour d’horizon Python 3.9 vient d’être annoncé le 6 Octobre 2020. Cette version amène plusieurs fonctionnalités très prometteuses. Corrige des bugs et se positionne par rapport à l’avenir du langage. A Cyrès, nous constatons une augmentation des développements Python, que ce soit dans le domaine du Big Data, des containeurs ou DevOps, Des …

Lire la suite

Page Linkedin Cyrès

Facebook

Twitter

07/21/2021 @ 6:36
2021 = 9 certifications GitLab pour Cyrès !
Et aussi des évolutions #tech pour nos clients 😀
✅ Sauvegardes de données 12x plus fréquentes
✅ Duplication sur site distant
✅ Updates dès leurs sorties
✅ Tps de résolution bug réduit
✅ Tps de livraison instances divisé / 2 https://t.co/MDq5FdNIVM
cyresgroupe photo
07/13/2021 @ 7:28
Comme toujours, #GitLab nous livre une version majeure en milieu d'année 👀

La v.14.0 est disponible depuis le 22 Juin.

Découvrez notre revue de cette mise à jour majeure sur le blog Cyrès - Clouds, DevOps & Big Data
https://t.co/wP8QCIeqJK

#DevOps #DevSecOps #GitOps https://t.co/1NN8lRsl3a
cyresgroupe photo