Bootcamp
Bootcamp Data Engineer / Data Ops
4.9/5
5/5
Acquérez les compétences clés pour le métiers de Data Engineer !
Objectifs pédagogiques
Le Bootcamp Data Ops / Data Engineer de 400 heures est conçu pour former les participants aux compétences clés pour le métier de Data Engineer. Cette formation couvre les fondamentaux de
l’ingénierie de données, y compris la collecte, le stockage, la transformation et la mise en production de données. Les participants apprendront à utiliser les outils et les technologies les plus couramment utilisés pour la gestion de l’ensemble du cycle de vie des données, ainsi qu’à mettre en place des pipelines de données fiables et évolutifs pour garantir la qualité et la disponibilité des données. La formation comprend également des modules sur la gestion de projets et les meilleures pratiques en matière de DevOps pour garantir une mise en oeuvre efficace des solutions de données.
- Acquérir les connaissances théoriques essentielles pour les métiers de DataOps, incluant les algorithmes, les structures de données, les systèmes d’exploitation, les réseaux et les outils de développement.
- Apprendre à analyser, visualiser et explorer les données pour découvrir des insights et maîtriser les technologies Big Data.
- Apprendre à déployer des projets data, y compris les modèles de machine learning et deep learning.
Modalités et moyens pédagogiques
Notre méthode pédagogique combine des apports théoriques, des exemples concrets et des cas pratiques avec l’expertise de nos formateurs pour offrir une formation complète et engageante, qu’elle soit dispensée en visioconférence ou en présentiel.
Dans le cadre de notre Bootcamp Data OPS / Data Engineer, nous personnalisons le parcours de formation en fonction des besoins de chaque participant. Des évaluations régulières sont prévues pour mesurer les progrès et une évaluation finale pour évaluer les connaissances acquises. Combinaison d’apports théoriques, d’exemples réels et de cas pratiques. Formation animée par des consultants et des formateurs expérimentés ayant une expertise dans leurs domaines.
Niveau requis
- Bac +2 (Bac accepté si expérience professionnelle significative).
- Un réel intérêt et une motivation pour le domaine de la data préconisés.
- Connaissances Mathématiques de base Niveau Bac +4 / Bac+5 : diplômé(e) de l’enseignement en informatique ou filières scientifiques, ingénieurs (universitaire ou autre).
Public concerné
- Marketing Analysts
- Chef de projets
- Développeurs
- Data Scientist
- Chefs de projets techniques
- Analyste de données
- Ingénieur en analyse de données
- Consultant en analyse de données
- Développeur de solutions de données
- Architecte SI
- Responsable du département informatique (DSI)
- Toute personne intéressée par les enjeux du Big Data et de l’IA
Programme détaillé
Module 1 – Les fondamentaux de la data
- Kit de survie: Maîtrise des outils indispensables (Github, Jupyter Notebook, PyCharm, VScode).
- Python pour la Data Science: Manipulation des librairies python (Pandas, Matplotlib, NumPy, SciPy).
- Les fondamentaux mathématiques: Développement des connaissances théoriques en algèbre linéaire, statistiques, et probabilités.
Module 2 – DataOps & DevSecOps
- Les fondamentaux.
- Utilisation des environnements de tests de préproduction.
- Gestion de containers et automatisation de la mise en production d’une application.
- Serveurs distants, systèmes Linux, Docker & Microservices, orchestration de services/Kubernetes.
- Déploiement, pipelines CI/CD (Terraform, Ansible), workflows et process, Apache Airflow.
Module 3 – Data Engineering – Fondamentaux
- Mise en production de projets Data dans le cloud.
- Hadoop, PySpark, Big Data, Data Mesh.
- ELT/ETL Architectures, data quality, data licenses, data modeling.
- Data lineage, metadata, testing, monitoring.
- Méthode Agile.
Module 4 – Stockage de données et bases de données SQL/NoSQL
- Bases de données SQL/NoSQL: Manipulation de MongoDB, ElasticSearch, Neo4J.
- Indexation, normalisation, partitionnement, distribution, MongoDB, web scraping, APIs.
Module 5 – Cloud et Datawarehouse
- Cloud: Maîtrise des solutions cloud d’Amazon AWS, Google Cloud Platform et Microsoft Azure.
- Monitoring de l’activité des serveurs.
- Automatisation de la création de serveurs, déploiement d’une infrastructure.
Module 6 – Datavisualisation et Monitoring
Vous souhaitez suivre cette formation ?
Cette formation est disponible en présentiel ou en classe à distance, avec un programme et une qualité pédagogique identiques.
Formation disponible sur mesure
Votre société a besoin d’une offre personnalisée ?