Administration Hadoop Hortonworks HDPCA (Niveau 1)

Cette formation s’adresse aux administrateurs systèmes et aux personnes qui gèrent et maintiennent les clusters Apache Hadoop en production, ou qui évoluent dans un environnement de développement. Il est utile d’avoir une expérience dans l’administration système Linux.

Aucune expérience avec Hadoop n’est nécessaire.    

99% clients satisfaits

+15 années d’éxperience

15 formations

+200 participants

Contenu de la formation

OBJECTIFS

L’objectif est qu’à la fin de la formation, les stagiaires pourront :

  • Installer un cluster Hortonworks sur AWS(Amazon Web Servcie)
  • Configurer un cluster Hortonworks
  • Haute disponibilité sur un cluster Hortonworks
  • Sécuriser un cluster Hortonworks
  • Maintenir un cluster Hortonwork

Certification HDPCA

Cette formation prépare à la certification Administration Hadoop Hortonworks HDPCA

PUBLIC

  • Architecte
  • Administrateur

PRE-REQUIS

  • Il est utile d’avoir une expérience dans l’administration Système Linux.
  • Aucune connaissance de Hadoop n’est requise

Programme : 

Jour 1:

Big Data, Hadoop et la plateforme Hortonworks : les bases du Big Data

  • Qu’est-ce que Hadoop ?
  • Une architecture de cluster type
  • Introduction à Ambari

Gestion des utilisateurs avec Ambari

  • Gérer les users et les groupes
  • Gérer les permissions
  • Mise en pratique : “Gestion des utilisateurs avec Ambari”

Utiliser le stockage HDFS

  • Accéder aux données
  • Gestion des fichiers
  • Mise en pratique : “Utiliser le stockage HDFS”
  • Mise en pratique : “Utiliser les ACLs HDFS”

Gestion des services Hadoop via Ambari

  • Configuration des services
  • Surveillance des services
  • Maintenance des services
  • Mise en pratique : “Gestion des services Hadoop”

Jour 2:
Installer la HDP

  • Identifier les options de déploiement de cluster
  • Planifier un déploiement de cluster
  • Faire une installation avec Ambari
  • Mise en pratique : “Installer la HDP”

Gestion des nœuds dans un cluster

  • Ajouter, enlever un nœud du cluster
  • Déplacer des composants
  • Mise en pratique : “Ajouter, décommissionner et recommissionner un nœud”

Gestion du stockage HDFS

  • Architecture HDFS
  • Assurer l’intégrité de la donnée
  • Mise en pratique : “Gestion du stockage sur HDFS”

Gestion des ressources avec YARN

  • Architecture de YARN
  • Utilisation de YARN
  • Les différentes façons de gérer YARN
  • Mise en pratique : “Configurer et gérer YARN”
  • Mise en pratique : “Gestion de YARN sans Ambari”

Jour 3:
Gestion des racks sur Hadoop

  • Les bénéfices de la “rack awareness”
  • Configurer la “rack awareness”
  • Mise en pratique : “Configurer la rack awareness”

Le capacity scheduler de YARN

  • Contrôler la répartition des ressources grâce aux queues YARN
  • Contrôler les accès sur les queues YARN
  • Mise en pratique : “Configuration des utilisateurs et des groupes pour YARN”
  • Mise en pratique : “Configurer les ressources avec les queues”
  • Mise en pratique : “Tuning de la gestion des ressources”

Découverte des applications YARN

  • Les bases d’une application YARN
  • Mise en pratique : “Démarrer une application YARN”

MAINTENANCE ET GESTION D’INCIDENT

  • Redémarrage d’un service
  • Consulter les logfiles d’une application
  • Diagnostiquer un job échoué

Activer la haute disponibilité avec HDFS et YARN

  • Les principes de la haute disponibilité
  • Haute disponibilité du Namenode
  • Haute disponibilité du Resource manager
  • Mise en pratique : “Configurer la haute disponibilité du namenode”
  • Mise en pratique : “Configurer la haute disponibilité du resource manager”

Jour 4:

Surveillance de cluster

  • Surveillance avec Ambari
  • Lever des alertes avec Ambari
  • Mise en pratique : “Configurer les alertes avec Ambari”

Protéger ses données

  • L’importance des backups
  • Les snapshots HDFS
  • Utiliser DistCP
  • Mise en pratique : “Gestion des snapshots HDFS”
  • Mise en pratique : “Utiliser DistCP”

SECURITE

  • Knox
  • Ranger

Les plus de la formation

Les formateurs sont des experts techniques et business en activité travaillant pour de grands comptes sur des projets à fortes valeurs ajoutées liés au Big Data. Les stagiaires pourront bénéficier de leurs expertises et de leurs retours d’expériences. Le but n’est pas de présenter les technologies Big Data comme une solution miracle.

Nous partagerons aussi les difficultés rencontrées par nos experts lors de leurs mises en œuvre. Nous vous offrirons également un kit d’outils et de documents qui vous permettront d’être autonome en disposant d’un environnement Big Data avec tout l’écosystème nécessaire pour travailler sur vos propres PC.

La formation s’appuie sur de nombreux cas pratiques inspirés de cas d’usages réels rencontrés par nos experts en entreprise.

Admin Big Data

  Code : ADMHADOOP

  Prix : 2400€ (HT)

  Prix Repas: 35 €

  Certification :  300 €

  Durée: 4 jours

  Lieu : Paris


Sessions

28/01/2019

16/04/2019

02/12/2019

Inscription

Ces professionnels nous font confiance

Ils témoignent de leurs expériences

“Formation avec beaucoup d’exercice, ce qui simplifie véritablement la compréhension. Encore merci pour le café et les biscuits 🙂  ”

Sebastien M

“Tout était clair et facile à comprendre avec beaucoup de patience du prof. La formation m’a apporté une vision d’ingénieur Bi.”

Zahojun H

Des formations qui pourraient vous intéresser

Nous vous proposons des formations de qualité, soigneusement préparées par des professionnels.

Ce que nos clients pensent de nous

“Après de sincères et profonds remerciements, je tiens à féliciter notre intervenant et par extension tout ceux qui ont contribué à cette formation, pour l’ apport que ce soit à un niveau personnel ou professionnel.
En effet , cette formation m’a permis non seulement de revisiter certains aspects  du Big Data avec une vision nouvelle et plus précise mais également d’assimiler de nombreuses connaissances . Les remarques pertinentes avec les détails pratiques ont permis de bénéficier du recul et de l’expérience de notre formateur.”

Mehdi Z

” Très bonne formation, ne surtout pas hésiter à partager ses expériences professionnels, que ce soit en terme de projets, de problèmes rencontrés dans le monde de l’entreprise ou encore de questions rencontrées en entretien.
Les plus de cette formation ont été la vision plus large qu’on peut se faire des projets de la vie réelle et des domaines qui accompagne le nôtre (data science), ainsi que de la culture pouvant aider à se démarquer lors d’un entretien. Pour finir, les supports étaient très clairs et les schémas rendaient les idées très simples à comprendre et retenir.”

Alexandre T

Newsletter

Retrouvez l’essentiel de l’actualité du Big Data directement par mail !

Les experts de Formation-BigData décortiquent chaque mois l’actualité, les dernières innovations.