Formation Machine Learning

Notée : (6)

Apprenez à utiliser le Machine Learning dans vos applications grâce aux solutions open source et aux plateformes cloud

Prix (Formation inter-entreprise)

2400€ HT / personne

Durée

3 jours

Dates

Nous pouvons organiser des sessions à d'autres dates ou dans d'autres villes (Bordeaux, Lille, Lyon, Marseille, Montpellier, Nantes, Nice, Paris, Strasbourg, Toulouse...)

Cette formation vous permettra d’acquérir les bases du Machine Learning. A la fin des 3 jours, vous serez autonome dans la mise en place de modèles prédictifs (création et déploiement). Vous serez en mesure de créer ces modèles dans votre domaine et de les utiliser en production, via des APIs reposant sur des solutions open source et/ou cloud, comme par exemple scikit-learn, Azure ML et Amazon ML.

Tout au long de la formation, vous mettrez en pratique la théorie en créant vous-même des modèles prédictifs.

Package complet de “Bootstrapping Machine Learning” inclus (en anglais)

Bootstrapping Machine Learning

Les participants à la formation recevront le livre Bootstrapping Machine Learning ainsi que sa version électronique en formats PDF, ePub et Mobi. Ils auront l’occasion, s’ils le souhaitent, de lire le livre avant le début de la formation.

A l’issue de la formation, les participants recevront également le contenu du “complete package” (d’une valeur de 299$), comprenant des screencasts, des notebooks IPython, du code, des jeux de données, une machine virtuelle, des vidéos et d'autres contenus additionnels.

Les objectifs

  • Comprendre les possibilités et les limites du Machine Learning (ML)
  • Formuler son propre problème de ML
  • Explorer et manipuler des données
  • Construire des modèles prédictifs à partir de données d’apprentissage
  • Utiliser ces modèles en production à l’aide d’APIs
  • Evaluer la performance et l’impact des modèles

Pré-requis

  • Bonne compréhension de l'anglais écrit (la formation est en français mais les slides, notebooks, le code et les autres ressources sont en anglais)
  • Connaissances basiques de programmation (en Python de préférence) et de la ligne de commande
  • Utilisation basique d’un tableur (ex: Microsoft Excel)
  • Connaissances basiques d’algèbre, de calcul et de probabilité pour la compréhension de certains modules théoriques
  • Ordinateur portable à apporter

Le programme de la formation Machine Learning

Jour 1 : Apprentissage automatique via outils open source

  • Présentation du Machine Learning et de ses possibilités:
    • Concepts de base
    • Formalisation des problèmes d’apprentissage supervisé: classification et régression
    • Exemples d’utilisation au sein d’applications web et mobile et exemples de Data Science en entreprise
  • Création d’un 1er modèle prédictif:
    • Intuitions derrière certaines techniques d’apprentissage: plus proches voisins (nearest neighbors), modèles linéaires, régression logistique et arbres de décision (decision trees)
    • Révision des bases du langage de script Python et utilisation de notebooks
    • Apprentissage d’un modèle avec la librairie open source scikit-learn
  • Préparation des données avant leur utilisation dans un système d’apprentissage:
    • Présentation des limites du Machine Learning
    • Importance du feature engineering
    • Techniques d’exploration et d’inspection de jeux de données
    • Procédures de nettoyage et traitement de données; mise en pratique avec la librairie open source Pandas et avec le Data Science Studio de Dataiku

Jour 2 : Evaluation et déploiement de modèles prédictifs

  • Evaluation des modèles prédictifs:
    • Séparation des données en jeu d’apprentissage, de validation et de test
    • Test de représentativité des données d’apprentissage
    • Analyse de performance des modèles prédictifs et mesures agrégées: accuracy, precision, recall, F-measure, matrices de confusion et de coût ("hard" classification), AUC, log-loss ("soft" classification), MSE, R-squared, MAPE (regression)
    • Optimisation du choix de seuil de classification et compromis entre objectifs concurrents
  • Sélection de modèles:
    • Procédure de cross-validation
    • Comment booster l’exactitude des prédictions grâce aux ensembles de modèles; application aux arbres de décision: random forests
    • Benchmarks de modèles avec l'utilitaire open source Scikit-Learn Laboratory (SKLL), bigmler et Dataiku
  • Déploiement:
    • Importance des APIs pour l’utilisation du ML en production
    • Passage en revue critique des solutions de déploiement open source et cloud
    • Création d’APIs sur modèles scikit-learn, avec Microsoft Azure ML
    • Fonctionnement des APIs, authentification et endpoints
    • Utilisation de Amazon Machine Learning et BigML: création de modèles et de prédictions via requêtes HTTP, wrappers Python, outils CLI et interfaces web
  • Utilisation du ML sur du texte:
    • Conseils de pré-traitement des données textuelles
    • Techniques d'extraction de features numériques: sac de mots et n-grams
    • Mise en pratique avec la librairie open source NLTK

Jour 3 : Aller plus loin avec le ML

  • Techniques avancées:
    • Principe du Gradient Boosting et utilisation de la librairie open source XGBoost (utilisée dans de nombreuses solutions gagnantes aux challenges de Data Science)
    • Pipelines de ML: enrichissement et sélection de features, modélisation
    • Techniques d'optimisation des paramètres de pipelines de ML: grid search, random search et utilisation de la librairie open source hyperopt
  • Autres problèmes d'apprentissage:
    • Apprentissage non supervisé: clustering et détection d’anomalies
    • Fonctionnement des algorithmes k-means, isolation forests, et visualisation interactive avec BigML
    • Systèmes de recommandation: réduction à un problème de classification, ou collaborative filtering
  • Réseaux de neurones et Deep Learning:
    • Présentation du perceptron à une couche; parallèle avec les modèles linéaires
    • Fonctionnement des réseaux de neurones de type MLP (Multi-Layered Perceptron)
    • Initiation à l'apprentissage de MLP simples avec les librairies open source TensorFlow et Keras; utilisation au sein de scikit-learn
    • Introduction au Transfer Learning: réutilisation de modèles existants pour extraire des features numériques à partir d'images et de texte ("embeddings")
    • Mise en pratique avec l’API de Indico
  • Développer son propre cas d’usage:
    • Formuler son propre problème de ML et créer de la valeur à partir de ses données: comment se poser les bonnes questions et spécifier les aspects clé du problème à l’aide du Machine Learning Canvas
    • Mise en application du Canvas sur son propre problème ou sur un exemple de cas d’usage au choix
  • Conclusion:
    • Récapitulatif des points clé de la formation
    • Ressources pour aller plus loin et suggestions personnalisées

Télécharger le programme

6 témoignages

Très bonne formation pour démystifier les solutions et la mise en oeuvre du Machine Learning.

Sylvain Centelles
Intel

Formation très conviviale et interactive en petit comité.

Jean-François Artaud
CEA

Cette formation permet de mettre les deux pieds dans le domaine du Machine Learning qui est en plein essort. Elle permet de bien voir les outils et solutions initiales à notre disposition pour répondre à de nombreuses problématiques.

Grégory LIVON
Intel

Très bonne formation au machine learning : le concept, les limites, comment l'appliquer en pratique... tout ça dans un cadre convivial.

Olivier DUPRAT
FNAC

Louis est un excellent pédagogue et on ressent qu'il connait et qu'il apprécie son domaine. Formation à recommander de toute urgence !

Charles-Emmanuel CAMUS
Groupe Express

Super moment passé avec Louis Dorard, qui transmet vraiment sa passion du machine learning au travers de cette formation. Beaucoup de temps passé à creuser les sujets à la volée dans des discussions impromptues, ce qui était vraiment appréciable

Sylvain Bourdos
Intel

Besoin d'aide ?

Vous souhaitez discuter avec nous à propos de votre projet de formation ?
Vous voulez plus d'information sur une formation ou notre fonctionnement ?


Rappel Email

Nos forces

  • Des formations à taille humaine
  • Des formateurs passionnés
  • Des véritables workshop
Accéder au Manifeste

Nos clients

BNP Paribas
Air France
Intel
SAP
Banque Postale
CNRS

Nos formations en images

Sass et Compass
CasperJS
Ruby on Rails
Ruby

Formation Machine Learning

Notée : (6)

Apprenez à utiliser le Machine Learning dans vos applications grâce aux solutions open source et aux plateformes cloud

Cette formation vous permettra d’acquérir les bases du Machine Learning. A la fin des 3 jours, vous serez autonome dans la mise en place de modèles prédictifs (création et déploiement). Vous serez en mesure de créer ces modèles dans votre domaine et de les utiliser en production, via des APIs reposant sur des solutions open source et/ou cloud, comme par exemple scikit-learn, Azure ML et Amazon ML.

Tout au long de la formation, vous mettrez en pratique la théorie en créant vous-même des modèles prédictifs.

Package complet de “Bootstrapping Machine Learning” inclus (en anglais)

Bootstrapping Machine Learning

Les participants à la formation recevront le livre Bootstrapping Machine Learning ainsi que sa version électronique en formats PDF, ePub et Mobi. Ils auront l’occasion, s’ils le souhaitent, de lire le livre avant le début de la formation.

A l’issue de la formation, les participants recevront également le contenu du “complete package” (d’une valeur de 299$), comprenant des screencasts, des notebooks IPython, du code, des jeux de données, une machine virtuelle, des vidéos et d'autres contenus additionnels.

Les objectifs

  • Comprendre les possibilités et les limites du Machine Learning (ML)
  • Formuler son propre problème de ML
  • Explorer et manipuler des données
  • Construire des modèles prédictifs à partir de données d’apprentissage
  • Utiliser ces modèles en production à l’aide d’APIs
  • Evaluer la performance et l’impact des modèles

Pré-requis

  • Bonne compréhension de l'anglais écrit (la formation est en français mais les slides, notebooks, le code et les autres ressources sont en anglais)
  • Connaissances basiques de programmation (en Python de préférence) et de la ligne de commande
  • Utilisation basique d’un tableur (ex: Microsoft Excel)
  • Connaissances basiques d’algèbre, de calcul et de probabilité pour la compréhension de certains modules théoriques
  • Ordinateur portable à apporter

Le programme de la formation Machine Learning

Jour 1 : Apprentissage automatique via outils open source

  • Présentation du Machine Learning et de ses possibilités:
    • Concepts de base
    • Formalisation des problèmes d’apprentissage supervisé: classification et régression
    • Exemples d’utilisation au sein d’applications web et mobile et exemples de Data Science en entreprise
  • Création d’un 1er modèle prédictif:
    • Intuitions derrière certaines techniques d’apprentissage: plus proches voisins (nearest neighbors), modèles linéaires, régression logistique et arbres de décision (decision trees)
    • Révision des bases du langage de script Python et utilisation de notebooks
    • Apprentissage d’un modèle avec la librairie open source scikit-learn
  • Préparation des données avant leur utilisation dans un système d’apprentissage:
    • Présentation des limites du Machine Learning
    • Importance du feature engineering
    • Techniques d’exploration et d’inspection de jeux de données
    • Procédures de nettoyage et traitement de données; mise en pratique avec la librairie open source Pandas et avec le Data Science Studio de Dataiku

Jour 2 : Evaluation et déploiement de modèles prédictifs

  • Evaluation des modèles prédictifs:
    • Séparation des données en jeu d’apprentissage, de validation et de test
    • Test de représentativité des données d’apprentissage
    • Analyse de performance des modèles prédictifs et mesures agrégées: accuracy, precision, recall, F-measure, matrices de confusion et de coût ("hard" classification), AUC, log-loss ("soft" classification), MSE, R-squared, MAPE (regression)
    • Optimisation du choix de seuil de classification et compromis entre objectifs concurrents
  • Sélection de modèles:
    • Procédure de cross-validation
    • Comment booster l’exactitude des prédictions grâce aux ensembles de modèles; application aux arbres de décision: random forests
    • Benchmarks de modèles avec l'utilitaire open source Scikit-Learn Laboratory (SKLL), bigmler et Dataiku
  • Déploiement:
    • Importance des APIs pour l’utilisation du ML en production
    • Passage en revue critique des solutions de déploiement open source et cloud
    • Création d’APIs sur modèles scikit-learn, avec Microsoft Azure ML
    • Fonctionnement des APIs, authentification et endpoints
    • Utilisation de Amazon Machine Learning et BigML: création de modèles et de prédictions via requêtes HTTP, wrappers Python, outils CLI et interfaces web
  • Utilisation du ML sur du texte:
    • Conseils de pré-traitement des données textuelles
    • Techniques d'extraction de features numériques: sac de mots et n-grams
    • Mise en pratique avec la librairie open source NLTK

Jour 3 : Aller plus loin avec le ML

  • Techniques avancées:
    • Principe du Gradient Boosting et utilisation de la librairie open source XGBoost (utilisée dans de nombreuses solutions gagnantes aux challenges de Data Science)
    • Pipelines de ML: enrichissement et sélection de features, modélisation
    • Techniques d'optimisation des paramètres de pipelines de ML: grid search, random search et utilisation de la librairie open source hyperopt
  • Autres problèmes d'apprentissage:
    • Apprentissage non supervisé: clustering et détection d’anomalies
    • Fonctionnement des algorithmes k-means, isolation forests, et visualisation interactive avec BigML
    • Systèmes de recommandation: réduction à un problème de classification, ou collaborative filtering
  • Réseaux de neurones et Deep Learning:
    • Présentation du perceptron à une couche; parallèle avec les modèles linéaires
    • Fonctionnement des réseaux de neurones de type MLP (Multi-Layered Perceptron)
    • Initiation à l'apprentissage de MLP simples avec les librairies open source TensorFlow et Keras; utilisation au sein de scikit-learn
    • Introduction au Transfer Learning: réutilisation de modèles existants pour extraire des features numériques à partir d'images et de texte ("embeddings")
    • Mise en pratique avec l’API de Indico
  • Développer son propre cas d’usage:
    • Formuler son propre problème de ML et créer de la valeur à partir de ses données: comment se poser les bonnes questions et spécifier les aspects clé du problème à l’aide du Machine Learning Canvas
    • Mise en application du Canvas sur son propre problème ou sur un exemple de cas d’usage au choix
  • Conclusion:
    • Récapitulatif des points clé de la formation
    • Ressources pour aller plus loin et suggestions personnalisées

Télécharger le programme

Le(s) formateur(s)

Louis Dorard

Louis Dorard

Louis Dorard est l’auteur du livre Bootstrapping Machine Learning, General Chair de PAPIs.io (International Conference on Predictive Applications and APIs), et Adjunct Teaching Fellow à UCL School of Management où il enseigne Predictive Analytics. Dans le cadre de son activité de consultant indépendant, Louis accompagne les sociétés dans la mise en place du Machine Learning et la valorisation de leurs données. Par le passé, il a “bootstrappé” plusieurs technologies innovantes en tant que Directeur R&D chez Concept Immo Global et fondateur de eAuteur. Louis est titulaire d’un PhD en Machine Learning de University College London.

Voir son profil détaillé

Suivi de formation en option

A l'issue de la formation, nos formateurs peuvent aussi intervenir pour vous accompagner dans la mise en application des compétences acquises :

  • en répondant à vos questions lors de rendez-vous téléphoniques réguliers
  • en étant présents physiquement à l'amorce du projet
  • en réalisant un audit de vos pratiques quelques semaines/mois après la formation
Cette idée vous intéresse ? Faîtes-le nous savoir pour que nous trouvions la formule adaptée à votre situation.

6 témoignages

Très bonne formation pour démystifier les solutions et la mise en oeuvre du Machine Learning.


Intel

Formation très conviviale et interactive en petit comité.


CEA

Cette formation permet de mettre les deux pieds dans le domaine du Machine Learning qui est en plein essort. Elle permet de bien voir les outils et solutions initiales à notre disposition pour répondre à de nombreuses problématiques.


Intel

Très bonne formation au machine learning : le concept, les limites, comment l'appliquer en pratique... tout ça dans un cadre convivial.


FNAC

Louis est un excellent pédagogue et on ressent qu'il connait et qu'il apprécie son domaine. Formation à recommander de toute urgence !


Groupe Express

Super moment passé avec Louis Dorard, qui transmet vraiment sa passion du machine learning au travers de cette formation. Beaucoup de temps passé à creuser les sujets à la volée dans des discussions impromptues, ce qui était vraiment appréciable


Intel