Data Science et Machine Learning pour recherche, une introduction.

Data Science et Machine Learning pour recherche, une introduction.

  • mCatégorieA DISTANCE
  • PublicDoctorants
  • Durée4 jours
  • Inscription

Que vous soyez Ingénieur, Chercheur, Doctorant ou développer et que vous travaillez avec l’analysées de données et vous désirez découvrir python pour la data science et le traitement des données, cette formation est faite pour vous. Quatre jours intensifs pour acquérir les bases de l’utilisation du langage python pour des applications en analyse de données, data mining et data science. Après une introduction au langage python (ou un rappel si vous avez déjà utilisé python), vous apprendrez à maîtriser les bibliothèques spécialisées en data science, data mining et data visualisation. Basée sur de nombreux exercices pratiques, cette formation vous permet d’être immédiatement opérationnel pour le traitement de vos données grâce à python.

CONTENU

Jour 1

  • Introduction au langage python
  • Les consoles et le débogage en python
  • Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
  • Construction d’un outil de calcul de statistiques simples
  • Les classes, les objets et la création de bibliothèques
  • Python pour le traitement des données
  • Le processus de développement d’un outil en python pour la data science
  • Cas pratique.

 

Jour 2 :

  • L’importation des données (texte, csv, Excel, web scrapping., SQL..)
  • La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
  • La data visualisation
  • Présentation des principes de la data visualisation
  • Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
  • Introduction à la machine Learning : présentation des principes de l’apprentissage automatique
  • Cas Practique

 

Jour 3:

  • Préparation des données avec la bibliothèque scikit-learn
  • Cas pratiques en machine learning
  • L’extraction d’informations pertinentes
  • Value estimation
  • Arbres de décision
  • Cas pratique

 

Jour 4:

  • Cas pratique de principe à fin.
  • Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants

Responsable pédagogique : Dr. Eulalio TORRES

  • Email (contact pédagogique) : ingetorresg@gmail.com
  • Dates prévisionnelles : Cf Améthis
  • Lieu : FORMATION A DISTANCE – Les modalités de connexion vous seront communiquées par les formateurs ultérieurement.
  • Durée : 4 jours avec séances de 6 heures.
  • Pré-requis : Bases de statistique sont recommandées mais ils ne sont pas obligatoires.