Machine Learning

Comment et pourquoi le Machine Learning joue-t-il un rôle essentiel dans la révolution du Big Data ? Augmentation du nombre de capteurs, explosion des réseaux sociaux, émergence de l’internet des objets, capacité de stockage toujours plus grande : autant de facteurs qui aujourd’hui confrontent les entreprises à un véritable déluge de données.

Comment faire pour analyser et valoriser cette masse de données complexes, dont la variabilité, la forte volumétrie et la grande dimensionnalité empêchent bien souvent l’application de méthodes statistiques traditionnelles ?

Au croisement des mathématiques et de l’informatique, le Machine Learning est un ensemble de modèles et d’algorithmes permettant à des systèmes d’apprendre automatiquement à partir de ces données et d’effectuer des tâches variées. Les progrès accomplis au cours de la dernière décennie dans cette discipline en plein essor ont conduit à la création d’algorithmes et de modèles de prédiction toujours plus performants. Ils constituent, combinés à la ressource en données et en puissance de calcul, un levier de transformation puissant pour les entreprises..

99% clients satisfaits

+15 années d’éxperience

15 formations

+200 participants

Contenu de la formation

OBJECTIFS

  • Connaitre le rôle essentiel du Machine Learning dans la révolution du Big Data
  • Cette formation vous permet de savoir comment analyser et valoriser cette masse de données complexes.

PUBLIC

  • Statisticien, Data Analyst, Data Scientist, Développeur

PRE-REQUIS

  • Connaissances de base en statistique
  • Connaissance minime en R

Introduction

  • Des statistiques au machine learning
  • Le métier de datascientist

 

Outils du datascientist

  • Langages du datascientist : R, Python, Scala
  • Big Data et frameworks de calcul distribués : Hadoop, Spark, H2O
  • IDE et notebooks : Rstudio, Zeppelin , Jupyter

 

 

Explorer et nettoyer sa donnée

  • Données quantitatives, qualitatives, mixtes
  • Analyse exploratoire
  • Data cleaning, denoising
  • TP R/Python SparklyR/Pyspark

Mettre en forme sa donnée : Feature engineering

  • The curse of dimensionnality
  • Echantillonage et bootstrap
  • Feature transformation/Feature creation
  • Corrélations et réduction de dimension : ACP, MDS, t-SNE, autoencoder
  • TP R/Python SparklyR/Pyspark

De la data vers l’algorithme

  • Algorithmes supervisés vs non supervisés
  • Classification : prédiction d’appartenance à une classe
  • Arbre de décision
  • Régression logistique
  • Ensemble d’arbres : Random Forest, Gradient Boosting Machine
  • SVM : Machines à vecteur de supports
  • Réseaux de neurones : Multi Layer Perceptron
  • Mesure de la qualité des résultats : AUC
  • TP R/Python SparklyR/Pyspark/H2O

Régression : prédiction de valeurs

  • Régression linéaire, régression linéaire généralisée
  • Random Forest
  • MLP
  • Mesure de la qualité des résultats : RMSE
  • TP R/Python SparklyR/Pyspark/H2O

Clustering et anomaly detection

  • Méthodes probabilistes : distributions gaussiennes, KDE
  • Clustering : Kmeans, DBSCAN, OPTICS, GMM clustering
  • Density based methods : Local Outlier Factor
  • Réseaux de neurones : Autoencoder
  • Mesure de la qualité des résultats : énergies intra/interclusters, distribution des erreurs de prédiction
  • TP R/Python SparklyR/Pyspark/H2O

Mesure de la robustesse de ses résultats 

  • Underfitting et overfitting
  • Validation croisée
  • Régularisation ridge, lasso
  • Aggrégation de modèles
  • TP R/Python SparklyR/Pyspark/H2O

Industrialiser un modèle :

  • Modèles R/Python/Spark/H2O
  • PMML
  • POJO/MOJO

Les plus de la formation

Cette formation concrète et pragmatique est illustrée par de nombreux exemples pratiques issus d’une expérience et d’un savoir-faire acquis sur de nombreux projets de taille variée au sein d’établissements et d’entreprises de différents secteurs. Vidéo-projection. Les supports de cours sont remis en début de formation.

Machine learning

  Code : MEAL

  Prix : 2300 (HT)

  Prix Repas: 35 €

  Durée: 3 jours

  Lieu : Paris


Sessions 2017

20/03/2018

15/10/2018

 

Inscription

Ces professionnels nous font confiance

Ils témoignent de leurs expériences

“Formation avec beaucoup d’exercice, ce qui simplifie véritablement la compréhension. Encore merci pour le café et les biscuits 🙂  ”

Sebastien M

“Tout était clair et facile à comprendre avec beaucoup de patience du prof. La formation m’a apporté une vision d’ingénieur Bi.”

Zahojun H

Des formations qui pourraient vous intéresser

Nous vous proposons des formations de qualité, soigneusement préparées par des professionnels.

Ce que nos clients pensent de nous

“Après de sincères et profonds remerciements, je tiens à féliciter notre intervenant et par extension tout ceux qui ont contribué à cette formation, pour l’ apport que ce soit à un niveau personnel ou professionnel.
En effet , cette formation m’a permis non seulement de revisiter certains aspects  du Big Data avec une vision nouvelle et plus précise mais également d’assimiler de nombreuses connaissances . Les remarques pertinentes avec les détails pratiques ont permis de bénéficier du recul et de l’expérience de notre formateur.”

Mehdi Z

” Très bonne formation, ne surtout pas hésiter à partager ses expériences professionnels, que ce soit en terme de projets, de problèmes rencontrés dans le monde de l’entreprise ou encore de questions rencontrées en entretien.
Les plus de cette formation ont été la vision plus large qu’on peut se faire des projets de la vie réelle et des domaines qui accompagne le nôtre (data science), ainsi que de la culture pouvant aider à se démarquer lors d’un entretien. Pour finir, les supports étaient très clairs et les schémas rendaient les idées très simples à comprendre et retenir.”

Alexandre T

Newsletter

Retrouvez l’essentiel de l’actualité du Big Data directement par mail !

Les experts de Formation-BigData décortiquent chaque mois l’actualité, les dernières innovations.