Blog

Les articles de nos équipes sont là pour transmettre des connaissances (techniques ou non) et des informations sur des sujets qui nous passionnent, ici chez Cyrès.

Spark 3 : Adaptive Query Execution, explication et optimisation

Spark 3 : Adaptive Query Execution, explication et optimisation

Publié le Modifié le

  J’ai assisté à un webinar Cloudera sur le tuning des performances d’applications Spark proposé par François Reynald, un des Senior Technical Instructor de Cloudera, il a d’ailleurs écrit cet article sur comment Spark 3 améliore les performances des SQL workloads. Et dans l’un des précédents articles du blog Cyrès, j’avais évoqué les principales nouveautés …

Lire la suite

Cas d’usage Nifi : pagination REST, Jolt et monitoring

Cas d’usage Nifi : pagination REST, Jolt et monitoring

Publié le Modifié le

Contexte A Cyrès, nous gérons la saisie des temps via un outil pratique et puissant : Toggl. Dans le cadre de l’amélioration du reporting, m’est venu l’idée d’intégrer les rapports CSV de cet outil, au sein de notre plateforme interne Cloudera. L’objectif de ce cas d’usage Nifi étant de pouvoir faire gagner du temps aux responsables …

Lire la suite

GitLab 13.8 – Quoi de neuf ?

GitLab 13.8 – Quoi de neuf ?

Publié le Modifié le

Avec la fin du mois, arrive comme d’habitude la nouvelle mouture de GitLab. Et cette version 13.8 va en ravir plus d’un ! En effet, cette nouvelle version apporte plus de 50 nouvelles fonctionnalités […]

Lire la suite

Gouvernance des données : CDP et Ranger, le Data Masking simplement

Gouvernance des données : CDP et Ranger, le Data Masking simplement

Publié le Modifié le

Introduction Que vos bases de données contiennent des données sensibles liées au bancaire, à la santé, aux données personnelles d’utilisateurs ou que vous ayez simplement à cœur de mettre en place une bonne gouvernance des données, vous allez sans doute devoir anonymiser vos données. Le data masking est une pratique qui peut être difficile à …

Lire la suite

GitLab 13.7 – Quoi de neuf ?

GitLab 13.7 – Quoi de neuf ?

Publié le Modifié le

Pour finir l’année en beauté, GitLab nous fournit sa dernière mouture de notre outil préféré, la version 13.7. Celle-ci est livrée avec pas moins de 45 nouvelles fonctionnalités et améliorations.

Lire la suite

Monitoring Nifi via streaming de bulletin dans Hive 3

Monitoring Nifi via streaming de bulletin dans Hive 3

Publié le Modifié le

Contexte Dans le cadre du suivi de production et le monitoring Nifi, je vais vous présenter un moyen que nous utilisons pour sauvegarder l’ensemble des évènements « bulletin » au sein d’un cluster Nifi. Après avoir évoqué les enjeux, je vous présenterai l’implémentation technique ainsi qu’une alternative avec Impala. Composants utilisés CDP Private Cloud 7.1.2 …

Lire la suite

Architecture Druid

Architecture Druid

Publié le Modifié le

  Apache Druid est une base de données analytique axé temps réel offrant la possibilité de persister des quantités de données immenses et d’en extraire de l’information à une vitesse hallucinante, le tout couvrant de nombreux use cases, Druid aurait donc tout pour plaire. Creusons l’architecture d’apache Druid ensemble. La dernière version stable de Druid …

Lire la suite

Page Linkedin Cyrès

Facebook

Twitter

04/20/2021 @ 4:52
Comment aménager une nouvelle salle d’hébergement sécurisée & énergiquement efficiente ?
C'est l'enjeu auquel a répondu #Cyrès en collab. avec @EFIRACK lors de l'extension de son #Datacenter Tier 3, ISO 27001 et HDS.
Les détails de ce projet en vidéo : https://t.co/vaLdiiJ1IE
03/22/2021 @ 12:58
[Spark 3]
L'arrivée de Spark 3 courant 2020 a changé la donne en matière de moteur de traitement de données dédié au Big Data. Dans cet article nous abordons en détail le fonctionnement de l'AQE (Adaptive Query Execution), la nouveauté de #Spark 3. https://t.co/qPGGBnv1iC https://t.co/ic9MT5C6jK
cyresgroupe photo