Nouvelle formation

Formation : IBM InfoSphere Advanced DataStage - Parallel Framework v11.5

Techniques avancées de développement de tâches parallèles dans DataStage

IBM InfoSphere Advanced DataStage - Parallel Framework v11.5

Techniques avancées de développement de tâches parallèles dans DataStage
Télécharger le programme Partager cette formation

Télécharger le programme Partager cette formation

Avec cette formation, vous explorerez des techniques avancées de développement de tâches parallèles dans DataStage. Vous approfondirez votre compréhension de l'architecture DataStage, en mettant l'accent sur les environnements de développement et d'exécution. Grâce à cette connaissance approfondie, vous serez en mesure de concevoir des tâches parallèles robustes, moins sujettes aux erreurs, facilement réutilisables et optimisées pour des performances améliorées.


Intra
Sur mesure

Formation dans vos locaux, chez nous ou à distance

Réf. IB7
  3j - 21h
Vous souhaitez transposer cette formation, sans modification, pour votre entreprise ?




Avec cette formation, vous explorerez des techniques avancées de développement de tâches parallèles dans DataStage. Vous approfondirez votre compréhension de l'architecture DataStage, en mettant l'accent sur les environnements de développement et d'exécution. Grâce à cette connaissance approfondie, vous serez en mesure de concevoir des tâches parallèles robustes, moins sujettes aux erreurs, facilement réutilisables et optimisées pour des performances améliorées.

Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
  • Comprendre l'architecture de traitement parallèle ainsi que les environnements de développement et d'exécution
  • Connaître les processus de compilation et d'exécution des travaux
  • Optimiser la phase de tri et de mise en mémoire tampon dans le cas de travaux en parallèle
  • Comprendre comment utiliser les types de données liés au cadre parallèle
  • Créer des composants de travaux réutilisables
  • Générer des étapes personnalisées intégrant des fonctions de transformation
  • Traiter des données XML dans les travaux DataStage
  • Concevoir une tâche qui traite une base de données de schéma en étoile

Public concerné
Développeurs expérimentés sur DataStage.

Prérequis
Avoir suivi la formation IBM InfoSphere DataStage Essentials ou posséder les connaissances équivalentes. Avoir au moins un an d'expérience dans le développement de tâches parallèles avec DataStage.
Vous recevrez par mail des informations permettant de valider vos prérequis avant la formation.

Programme de la formation

Introduction à l'architecture du Parallel Framework

  • Décrire l’architecture de traitement parallèle.
  • Présentation du pipeline et des partitions.
  • Décrire le rôle du fichier de configuration.
  • Conception d'une tache de création de tests de données.

Compilation et exécution des tâches

  • Décrire les principales parties du fichier de configuration.
  • Le processus de compilation.
  • L'OSH généré par le processus de compilation.
  • Rôle et principales parties du Score.

Partitionnement et collecte de données

  • Comprendre le fonctionnement du partitionnement dans le Framework.
  • Afficher des partitions dans le Score.
  • Sélectionner des algorithmes de partitionnement.
  • Générer des séquences de nombres (clés de substitution) dans un environnement parallèle partitionné.

Tri des données

  • Trier les données.
  • Rechercher les tris insérés dans le Score.
  • Réduire le nombre de tris insérés.
  • Optimiser l'emploi des jointures.
  • Utiliser les étapes de tri pour déterminer la dernière ligne d’un groupe.
  • Décrire la clé de tri et la clé logique de partitionnement.

Gestion des buffers en exécution parallèle

  • Fonctionnement des buffers.
  • Optimisation des buffers.

Types de données

  • Décrire les Virtual Data Sets.
  • Décrire les schémas.
  • Conversion de types.
  • Gestion des données externes.
  • Gérer les valeurs nulles.
  • Travailler avec des données complexes

Composants réutilisables

  • Créer un schéma de fichier.
  • Lecture séquentielle d'un fichier à l'aide d'un schéma.
  • Utiliser Runtime Column Propagation (RCP).
  • Créer et utiliser des conteneurs.

Optimisation équilibrée

  • Activer la fonctionnalité d’optimisation équilibrée dans Designer.
  • Décrire les processus d'optimisation.
  • Répertorier les différentes options d’optimisation équilibrée.


Certification
Cette formation prépare à la certification IBM Certified Solution Developer - InfoSphere DataStage v11.3.
Comment passer votre examen ?

Méthodes et moyens pédagogiques
Méthodes pédagogiques;
Animation de la formation en français. Support de cours officiel au format numérique et en anglais. Bonne compréhension de l'anglais à l'écrit.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Solutions de financement
Pour trouver la meilleure solution de financement adaptée à votre situation : contactez votre conseiller formation.
Il vous aidera à choisir parmi les solutions suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • France Travail sous réserve de l’acceptation de votre dossier par votre conseiller France Travail.

Horaires
En présentiel, les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45. Les pauses et déjeuners sont offerts.
Pour les stages pratiques de 4 ou 5 jours, quelle que soit la modalité, les sessions se terminent à 16h le dernier jour.