Toutes nos formations sont désormais disponibles en "Live Virtual classes". Contactez-nous pour plus d’informations : formation@oxiane.luToutes nos formations sont désormais disponibles en "Live Virtual classes". Contactez-nous pour plus d’informations : formation@oxiane.lu

Introduction au Big Data et Machine Learning

Accueil » Formations » Data » Introduction au Big Data et Machine Learning
1230 € HT 2 jours DB-BIGML

Programme

Comprendre les concepts et les enjeux du Big Data

  • Découvrir les concepts du Big Data
  • Définition d’un projet Big Data
  • Big data en entreprise
    • Principes de fonctionnement
    • Les secteurs impactés
    • Comment se reconvertir dans le big data ?
    • La gouvernance des données
  • Les spécificités d’un projet big data
  • Les enjeux du Big Data : organisation, confidentialité des données, GPDR.

Les technologies du Big Data

  • Business Intelligence vs Big Data
  • Architecture et composants de la plateforme Hadoop.
  • Les modes de stockage
    • Le stockage fichiers : Hadoop Distributed File System (HDFS).
    • Stockage colonne, graph, clé/valeur et document :
  • Paradigme MapReduce
  • Spark : framework de calcul distribué in memory
  • Les architectures big data.
  • Les technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview …).

Atelier :

  • Installation d’une plateforme Big Data Hadoop
  • Implémentation de flux de données massives.

Data Science : Méthodes d’analyse et traitements des données pour le Big Data

  • Les bases de l’apprentissage Machine (Machine Learning)
  • Prétraitement des données
  • La réduction de dimensions
  • Les types des modèles du machine learning : Clustering, Classification, Regression
  • L’évaluation des modèles.
  • Les méthodes d’ensemble.
  • Le langage Python pour le Big Data et le Machine Learning : Pandas, Scipy, Scikit-learn, TensorFlow.
  • Communiquer ses résultats à l’aide de représentations graphiques lisibles et pertinentes.

Ateliers Données:

  • Visualisation des données
  • Exploration et sélection/ingénierie des variables
  • Application des méthodes d’apprentissage automatique
  • Sélection de modèles et méthodes d’ensemble