Machine Learning
Comment et pourquoi le Machine Learning joue-t-il un rôle essentiel dans la révolution du Big Data ? Augmentation du nombre de capteurs, explosion des réseaux sociaux, émergence de l’internet des objets, capacité de stockage toujours plus grande : autant de facteurs qui aujourd’hui confrontent les entreprises à un véritable déluge de données.
Comment faire pour analyser et valoriser cette masse de données complexes, dont la variabilité, la forte volumétrie et la grande dimensionnalité empêchent bien souvent l’application de méthodes statistiques traditionnelles ?
Au croisement des mathématiques et de l’informatique, le Machine Learning est un ensemble de modèles et d’algorithmes permettant à des systèmes d’apprendre automatiquement à partir de ces données et d’effectuer des tâches variées. Les progrès accomplis au cours de la dernière décennie dans cette discipline en plein essor ont conduit à la création d’algorithmes et de modèles de prédiction toujours plus performants. Ils constituent, combinés à la ressource en données et en puissance de calcul, un levier de transformation puissant pour les entreprises..
99% clients satisfaits
+15 années d’éxperience
15 formations
+200 participants
Contenu de la formation
OBJECTIFS
- Connaitre le rôle essentiel du Machine Learning dans la révolution du Big Data
- Cette formation vous permet de savoir comment analyser et valoriser cette masse de données complexes.
PUBLIC
- Statisticien, Data Analyst, Data Scientist, Développeur
PRE-REQUIS
- Connaissances de base en statistique
- Connaissance minime en R
Introduction
- Des statistiques au machine learning
- Le métier de datascientist
Outils du datascientist
- Langages du datascientist : R, Python, Scala
- Big Data et frameworks de calcul distribués : Hadoop, Spark, H2O
- IDE et notebooks : Rstudio, Zeppelin , Jupyter
Explorer et nettoyer sa donnée
- Données quantitatives, qualitatives, mixtes
- Analyse exploratoire
- Data cleaning, denoising
- TP R/Python SparklyR/Pyspark
Mettre en forme sa donnée : Feature engineering
- The curse of dimensionnality
- Echantillonage et bootstrap
- Feature transformation/Feature creation
- Corrélations et réduction de dimension : ACP, MDS, t-SNE, autoencoder
- TP R/Python SparklyR/Pyspark
De la data vers l’algorithme
- Algorithmes supervisés vs non supervisés
- Classification : prédiction d’appartenance à une classe
- Arbre de décision
- Régression logistique
- Ensemble d’arbres : Random Forest, Gradient Boosting Machine
- SVM : Machines à vecteur de supports
- Réseaux de neurones : Multi Layer Perceptron
- Mesure de la qualité des résultats : AUC
- TP R/Python SparklyR/Pyspark/H2O
Régression : prédiction de valeurs
- Régression linéaire, régression linéaire généralisée
- Random Forest
- MLP
- Mesure de la qualité des résultats : RMSE
- TP R/Python SparklyR/Pyspark/H2O
Clustering et anomaly detection
- Méthodes probabilistes : distributions gaussiennes, KDE
- Clustering : Kmeans, DBSCAN, OPTICS, GMM clustering
- Density based methods : Local Outlier Factor
- Réseaux de neurones : Autoencoder
- Mesure de la qualité des résultats : énergies intra/interclusters, distribution des erreurs de prédiction
- TP R/Python SparklyR/Pyspark/H2O
Mesure de la robustesse de ses résultats
- Underfitting et overfitting
- Validation croisée
- Régularisation ridge, lasso
- Aggrégation de modèles
- TP R/Python SparklyR/Pyspark/H2O
Industrialiser un modèle :
- Modèles R/Python/Spark/H2O
- PMML
- POJO/MOJO
Les plus de la formation
Cette formation concrète et pragmatique est illustrée par de nombreux exemples pratiques issus d’une expérience et d’un savoir-faire acquis sur de nombreux projets de taille variée au sein d’établissements et d’entreprises de différents secteurs. Vidéo-projection. Les supports de cours sont remis en début de formation.
Ces professionnels nous font confiance
Ils témoignent de leurs expériences
“Formation avec beaucoup d’exercice, ce qui simplifie véritablement la compréhension. Encore merci pour le café et les biscuits 🙂 ”
“Tout était clair et facile à comprendre avec beaucoup de patience du prof. La formation m’a apporté une vision d’ingénieur Bi.”
Des formations qui pourraient vous intéresser
Nous vous proposons des formations de qualité, soigneusement préparées par des professionnels.
Ce que nos clients pensent de nous
“Après de sincères et profonds remerciements, je tiens à féliciter notre intervenant et par extension tout ceux qui ont contribué à cette formation, pour l’ apport que ce soit à un niveau personnel ou professionnel.
En effet , cette formation m’a permis non seulement de revisiter certains aspects du Big Data avec une vision nouvelle et plus précise mais également d’assimiler de nombreuses connaissances . Les remarques pertinentes avec les détails pratiques ont permis de bénéficier du recul et de l’expérience de notre formateur.”
” Très bonne formation, ne surtout pas hésiter à partager ses expériences professionnels, que ce soit en terme de projets, de problèmes rencontrés dans le monde de l’entreprise ou encore de questions rencontrées en entretien.
Les plus de cette formation ont été la vision plus large qu’on peut se faire des projets de la vie réelle et des domaines qui accompagne le nôtre (data science), ainsi que de la culture pouvant aider à se démarquer lors d’un entretien. Pour finir, les supports étaient très clairs et les schémas rendaient les idées très simples à comprendre et retenir.”
Newsletter
Retrouvez l’essentiel de l’actualité du Big Data directement par mail !
Les experts de Formation-BigData décortiquent chaque mois l’actualité, les dernières innovations.