Expertise

Python pour la data science

4.9/5

 5/5

Maîtrisez les techniques avancées de la data science et de l’apprentissage automatique !

Objectifs pédagogiques

Notre formation complète en Python pour la data science est conçue pour les professionnels souhaitant maîtriser les techniques avancées de la data science et de l’apprentissage automatique. Au cours de cette formation, les participants acquerront une solide compréhension du langage Python, ainsi que des outils et bibliothèques populaires pour la collecte, la préparation et l’analyse de données.

Maîtriser les bases du langage Python et les bibliothèques pour la collecte et la manipulation de données (Numpy, Pandas).
Comprendre et implémenter des algorithmes d’apprentissage automatique avec Scikit-learn.
Se familiariser avec les outils de visualisation de données et de traitement de données volumineuses.
Pratiquer en effectuant des projets pratiques, développer des compétences en débogage et en gestion de versions, et comprendre les opportunités de carrière dans le domaine de la science des données et du machine learning.

Modalités et moyens pédagogiques

Notre méthode pédagogique combine des apports théoriques, des exemples concrets et des cas pratiques avec l’expertise de nos formateurs pour offrir une formation complète et engageante, qu’elle soit dispensée en visioconférence ou en présentiel.

Notre programme de formation en Python pour la Data Science est personnalisé pour chaque participant grâce à une évaluation approfondie de leurs besoins de formation. Des évaluations régulières sont effectuées tout au long du parcours pour mesurer les progrès accomplis, ainsi qu’une évaluation finale pour évaluer les connaissances acquises. Cette approche individualisée permet aux participants d’acquérir les compétences et les connaissances spécifiques à leurs besoins, pour une expérience d’apprentissage plus efficace et pertinente en machine learning.

Niveau requis

Notions de programmation ou No-Code.
Connaissance des mathématiques et de la statistique (algèbre linéaire, calcul différentiel et intégral, probabilités, statistiques descriptives).
Connaissance de base en informatique (structure de données, algorithmes, bases de données).

Public concerné

Business analysts
Développeurs Web
Ingénieurs en intelligence artificielle
Analystes de données marketing
Analystes de données financières
Architectes de solutions de données
Ingénieurs de données cloud
Chefs de projets techniques

Programme détaillé

Module 1 – Introduction à l’écosystème Python scientifique

Panorama de l’écosystème scientifique de Python.
Les librairies incontournables pour la data science.
Les principaux outils et logiciels open source pour la data science.
Anaconda et les environnements virtuels.
IPython et Jupyter.

Module 2 – Mise en place de l’environnement de développement

Installation d’Anaconda.
Création d’un environnement virtuel.
Utilisation des notebooks Jupyter.

Module 3 – Le socle scientifique de Python – La SciPy Stack

Numpy pour le calcul numérique et l’algèbre linéaire.
SciPy pour les statistiques, les analyses fonctionnelles, géo spatiales, le traitement du signal.
Pandas pour l’analyse de données tabulaires.
Matplotlib pour la visualisation de données.

Module 4 – Utilisation de la SciPy Stack

Mesure des performances de Numpy.
Traitement d’images avec Numpy.
Premiers tracés avec Matplotlib.
Analyses statistiques de fichiers CSV.
Transformées de Fourier.

Module 5 – Les librairies de visualisation

Savoir sécuriser le SI interne.
Savoir détecter puis traiter les incidents.
Connaître les responsabilités juridiques liées à la gestion des SI.

Module 6 – Utilisation des librairies de visualisation

Librairies orientées desktop : Matplotlib, Pandas, Seaborn.
Librairies orientées web : Bokeh, altair, Plotly.
Librairies pour la 3D : Plotly, pythreejs, ipyvolume.
Librairies cartographiques : Cartopy, folium, ipyleaflet, Bokeh, cesiumpy.
Librairies big data : datashader, Vaex

Module 7 – Les formats de fichiers scientifiques et la manipulation de données volumineuses

Les principaux formats de fichiers scientifiques : NetCDF, HDF5, GRIB, JSON, PARQUET, MATLAB, CGNS.
Manipuler des données volumineuses avec Dask, Vaex et Xarray.

Module 8 – Travaux pratiques – Utilisation des formats de fichiers scientifiques et la manipulation de données volumineuses

Manipulation de données dépassant les Go.
Lecture et écriture de fichiers NetCDF/HDF5.
Visualisation de données climatiques, images satellites, création de vidéos/animations graphiques.

Inscription à la prochaine session

Vous souhaitez suivre cette formation ?

Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.

Formation disponible sur mesure

Votre société a besoin d’une offre personnalisée ?

Contactez-nous