Objectifs

Dans le cours DP-203T00-AC: Data Engineering on Microsoft Azure, les apprenants découvriront les modèles et les pratiques d'ingénierie des données en ce qui concerne l'utilisation de solutions analytiques par lots et en temps réel à l'aide des technologies de Azure Data Plateform. Ce cours s’adresse aux professionnels des données, aux architectes de données et aux professionnels du Business Intelligence qui souhaitent en savoir plus sur l'ingénierie des données et la création de solutions analytiques à l'aide des technologies de plateforme de données qui existent sur Microsoft Azure. Ce cours prépare les apprenants à passer l'examen de certification DP-203.

Après avoir terminé ce cours, les apprenants seront à mesure de :

Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données

Concevoir et mettre en œuvre de la couche servante

Comprendre les considérations relatives à l'ingénierie des données

Exécuter des requêtes interactives à l'aide des pools SQL

Explorer, transformer et charger des données dans l’entrepôt de données à l'aide d'Apache Spark

Effectuer l’exploration et la transformation des données dans Azure Databricks

Ingérer et charger des données dans l'entrepôt de données

Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines

Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse

Analyser et optimiser le stockage de l'entrepôt de données

Prendre en charge le traitement hybride analytique transactionnel (HTAP= Hybrid Transactional Analytical Processing) avec Azure Synapse Link

Mettre en place la sécurité de bout en bout avec Azure Synapse Analytics

Traiter le flux en temps réel avec Stream Analytics

Créer une solution de traitement de flux avec Event Hubs et Azure Databricks

Créer des rapports à l'aide de Power BI intégration avec Azure Synapse Analytics

Exécuter des processus d'apprentissage automatique intégré dans Azure Synapse Analytics

 

Pré réquis

AZ-900 Principes fondamentaux d'Azure

DP-900 Principes fondamentaux des données Microsoft Azure

 

Contenu

Module 1: Explorer les options de calcul et de stockage des charges de travail d'ingénierie des données

Cours

Introduction à Azure Synapse Analytics
Décrire Azure Databricks
Introduction au stockage Azure Data Lake
Décrire l'architecture Delta Lake
Travailler avec des flux de données à l'aide d'Azure Stream Analytics

TPs : Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données

Module 2: Concevoir et mettre en œuvre la couche servante

Cours

Concevoir un schéma multidimensionnel pour optimiser les charges de travail analytiques
Transformation "code-free" à grande échelle avec Azure Data Factory
Remplir les dimensions à évolution lente dans les pipelines Azure Synapse Analytics

TPs : Conception et mise en œuvre de la couche servante

Module 3: Considérations relatives à l'ingénierie des données des fichiers source

Cours

Concevoir un entrepôt de données moderne à l'aide d'Azure Synapse Analytics
Sécuriser un entrepôt de données dans Azure Synapse Analytics

TPs : Considérations relatives à l'ingénierie des données

Module 4: Exécuter des requêtes interactives à l'aide des pools SQL de Azure Synapse Analytics

Cours

Explorer les capacités des pools SQL de Azure Synapse
Interroger les données dans le lac à l'aide des pools SQL de Azure Synapse
Créer des objets de métadonnées dans les pools SQL de Azure Synapse
Sécuriser les données et gérer les utilisateurs dans les pools SQL de Azure Synapse  

TPs : Exécuter des requêtes interactives à l'aide des pools SQL

Module 5: Explorer, transformer et charger des données dans l’entrepôt de données à l'aide d'Apache Spark

Cours

Comprendre l'ingénierie du Big Data avec Apache Spark dans Azure Synapse Analytics
Ingérer des données avec des blocs-notes Apache Spark dans Azure Synapse Analytics
Transformer les données avec les DataFrames dans les pools Apache Spark dans Azure Synapse Analytics
Intégrer les pools SQL et Apache Spark dans Azure Synapse Analytics

TPs : Explorer, transformer et charger des données dans l’entrepôt de données à l'aide d'Apache Spark

Module 6: Exploration et transformation des données dans Azure Databricks

Cours

Décrire Azure Databricks
Lire et écrire des données dans Azure Databricks
Utiliser des DataFrames dans Azure Databricks
Travailler avec les méthodes avancées DataFrames dans Azure Databricks   

TPs : Exploration et transformation des données dans Azure Databricks

Module 7: Ingérer et charger des données dans l'entrepôt de données

Cours

Utiliser les bonnes pratiques de chargement de données dans Azure Synapse Analytics
Ingestion à l'échelle de pétaoctet avec Azure Data Factory    

TPs : Ingérer et charger des données dans l'entrepôt de données

Module 8: Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines

Cours

Intégration de données avec Azure Data Factory ou Azure Synapse Pipelines
Transformation "code-free" à grande échelle avec Azure Data Factory ou Azure Synapse Pipelines    

TPs : Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines

Module 9: Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

Cours

Orchestrer le mouvement et la transformation des données dans Azure Data Factory   

TPs : Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

Module 10: Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse

Cours

Optimiser les performances des requêtes d'entrepôt de données dans Azure Synapse Analytics
Comprendre les fonctionnalités du développeur d'entrepôt de données d'Azure Synapse Analytics   

TPs : Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse

Module 11: Analyser et optimiser le stockage de l'entrepôt de données

Cours

Analyser et optimiser le stockage de l'entrepôt de données dans Azure Synapse Analytics    

TPs : Analyser et optimiser le stockage de l'entrepôt de données

Module 12: Prise en charge du traitement analytique transactionnel hybride (HTAP= Hybrid Transactional Analytical Processing) avec Azure Synapse Link

Cours

Concevoir un traitement hybride transactionnel et analytique  à l'aide d'Azure Synapse Analytics
Configurer Azure Synapse Link avec Azure Cosmos DB
Interroger Azure Cosmos DB avec les pools Apache Spark
Interroger Azure Cosmos DB avec des pools SQL   

TPs : Prise en charge du traitement hybride analytique transactionnel (HTAP= Hybrid Transactional Analytical Processing) avec Azure Synapse Link

Module 13: Sécurité de bout en bout avec Azure Synapse Analytics

Cours

Sécuriser un entrepôt de données dans Azure Synapse Analytics
Configurer et gérer les secrets dans Azure Key Vault
Mettre en œuvre des contrôles de conformité pour les données sensibles    

TPs : Sécurité de bout en bout avec Azure Synapse Analytics

Module 14: Traitement de flux en temps réel avec Stream Analytics

Cours

Activer une messagerie fiable pour les applications Big Data à l'aide d'Azure Event Hubs
Travailler avec des flux de données à l'aide d'Azure Stream Analytics
Ingérer des flux de données avec Azure Stream Analytics    

TPs : Traitement de flux en temps réel avec Stream Analytics

Module 15: Créer une solution de traitement de flux avec Event Hubs et Azure Databricks

Cours

Traiter les données de streaming avec le streaming structuré Azure Databricks   

TPs : Créer une solution de traitement de flux avec Event Hubs et Azure Databricks

Module 16: Créer des rapports à l'aide de Power BI integration avec Azure Synapse Analytics

Cours

Créer des rapports à l'aide de Power BI integration avec Azure Synapse Analytics   

TPs : Créer des rapports à l'aide de Power BI intégration avec Azure Synapse Analytics

Module 17: Exécuter des processus d'apprentissage automatique intégré dans Azure Synapse Analytics

Cours

Utiliser le processus d'apprentissage automatique intégré dans Azure Synapse Analytics

TPs : Exécuter des processus d'apprentissage automatique intégré dans Azure Synapse Analytics

 

Durée

La formation se déroule en formation à distance. Elle dure 05 jours en formation accélérée ou deux mois en formation rythmée les week-ends. Elle comptabilise 35 heures au total.

 

Ressources

Les apprenants auront accès aux ressources officielles (cours magistraux et TPs) via le compte Microsoft Learning Partner de l’entreprise. La formation se déroulera en vidéoconférence à l’aide de Microsoft Teams et les TPs seront directement accessibles en ligne. Les cours magistraux seront enregistrés et consultables à tout moment. 

 

Avantages

Support de cours (cours théoriques et TPs) offert aux stagiaires

Préparation à la certification à l’aide de fichier dumps

Séances de visio-conférence enregistrées

Voucher (bon de réduction à 100%) de certification offert aux stagiaires


Coût et modalités

 

Particulier

Entreprise

Total :Formation+Certification

700 000 F CFA

1 500 000 F CFA

 

NB: Les documents à fournir lors de l’inscription concernent les particuliers.

PROCHAINES SESSIONS À DISTANCE CONFIRMÉES : 17/04/2022 et 17/06/2022.