En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de cookies pour vous proposer des services et offres adaptés à vos centres d’intérêts.
Pour en savoir plus et paramétrer les cookies, suivez ce lien
Développeur de compétences
  •  
  •  
  •  

Talend Open Studio Data Integration


  • Objectifs
  • Profils
  • Pré-requis
  • Moyens pédagogiques
  • Certificat / Attestation
  • Comprendre le processus d'intégration de données
  • Maîtriser l'outil Talend Open Studio et la bibliothèque de composants
Trouvez votre prochaine formation

Programme

  • 5 Jours, 35h
  • 3095 HT *
    Introduction
    • Problématique d'intégration de données
    • Intégration Opérationnelle et Décisionnelle
    • Outils ETL (Extract Transform Load) disponibles
    • Talend Open Studio : présentation, licences, lien avec Eclipse
    • Support disponible : documentation, communauté, …

    Découvrir l'interface
    • Les perspectives et les vues Talend
    • Utilisation du Business Modeler
    • Les jobs : grille, palette de composants
    • Les flux principaux (main)
    • La notion de schéma : types des colonnes
    • Premiers composants : entrée, sortie, génération de flux

    Les principaux composants de Talend
    • Composants d'entrée (tFileInput, tMysqlInput, …)
    • Génération de contenu (tRowGenerator, tFixedFlowInput, ...)
    • Sorties et affichage (tLogRow, tFileOutput, tMysqlOutput, …)
    • Logique et chaînage des composants
    • Suivi pas à pas des traces de l'exécution du job
    • Gestion des rejets
    • Transformations simples (filtre, tri, remplacement, jointure)

    Garantir la pérennité des jobs
    • Versions et statuts des jobs
    • Les métadonnées : propriétés et schémas.
    • La découverte de schéma pour les fichiers CSV
    • Récupération des schémas de bases de données
    • Mises à jour des jobs depuis les métadonnées

    Variables et contextes
    • Utiliser des variables dans un job (tSetGlobalVar)
    • Mise en place d'un contexte local au job
    • Groupes de contexte dans le référentiel
    • Les métadonnées comme contextes

    Le mappage de données : tMap
    • Le composant ETL par excellence
    • Gérer les entrées : flux principal, secondaires, nommage des flux
    • Gérer les sorties : l'éditeur intégré de la tMap
    • Filtrer les données : en entrée, sortie
    • Sorties conjointes, capture des rejets de sortie, de jointure interne
    • L'éditeur d'expression
    • Les performances

    Orchestration des jobs, gestion d'erreurs
    • Exécutions parallèles de sous-jobs
    • Déclencheurs Talend (triggers)
    • Enchaînement de sous-jobs et de composants (OnSubjobOK, OnComponentOK)
    • Gestion des erreurs de composants, sous-job (OnComponentError, OnSubjobError)
    • Composant de départ, et de fin (tPreJob, tPostJob)
    • Attraper et lever des erreurs : tWarn, tDie, tLogCatcher

    Les flux de programmation : liens iterate
    • Différencier les flux principaux des flux iterate
    • Boucles et programmation via tLoop, tForeach
    • Passer d'un flux principal à un flux iterate, et l'inverse (tFlowToIterate, tIterateToFlow)
    • Synchronisation de jobs avec les tWaitForFile, tWaitForSocket, tWaitForSQL

    Utilisation avancée
    • Utilisation de composants évolués : Java ou expressions régulières
    • La spécificité des flux XML dans Talend
    • Réutilisation du code : les routines

    Déboguage dans Talend
    • Rappels sur le débogage de traces
    • Utilisation du mode Debug Java : perspective Debug, mode pas à pas
    • Visualisation et modification à chaud des variables

    Déploiement et industrialisation
    • Rappel sur les contextes
    • Export des jobs pour exécution sur un serveur
    • Passage de contexte entre jobs, à l'exécution
    • Utilisation d'un fichier pour charger le contexte (tContextLoad)

    Utilisation avancée
    • Utilisation de composants évolués : Java ou expressions régulières
    • Création de logs spécifiques
    • Gestion des flux XML
    • Réutilisation du code

    Les composants Talend
    • Concepts essentiels pour étendre Talend Open Studio
    • Création de la maquette du composant avec tJavaFlex / interface graphique
    • Découvrir la forge Talend et ses composants communautaires
    • Intégration dans Talend Open Studio des plugins créés ou téléchargés

* La durée et le prix de la formation sont donnés à titre indicatif pour une inscription en inter-entreprises. Toute demande intra-entreprise fait systématiquement l’objet d’un devis sur-mesure devant être approuvé pour acceptation.