Fondamenti di data warehouse - corso 44.500 rubli. da IBS Training Center, formazione 24 ore, Data 26 novembre 2023.
Miscellanea / / November 30, 2023
Durante il corso acquisirai familiarità con i concetti di base e le sfide che sorgono durante la creazione di data warehouse. Comprendere come gli obiettivi influenzano la scelta dell'architettura e quali conseguenze possono derivare da un'attenzione insufficiente ai componenti. Fatti un'idea dei ruoli e dell'influenza dei membri del team sul risultato. Il programma del corso descriverà approcci pratici alla progettazione e all'implementazione di data warehouse e dei suoi componenti. Esaminerai la gestione del ciclo di vita, inclusa la disattivazione e la migrazione a nuovi sistemi, e tratterai argomenti di gestione dei dati e creazione di servizi basati su di essa. Nella parte pratica, gli studenti saranno divisi in due team: uno dei team lavorerà su un progetto di migrazione dello storage dati tenendo conto degli obiettivi di sviluppo strategico dell'impresa, e il secondo li valuterà in termini di capacità, risorse e scadenze.
Argomenti trattati:
1. Introduzione (teoria + pratica 2,5 ore).
Il concetto di “data warehouse”. Le sue capacità e i suoi limiti
Perché viene creato DWH, quale problema aziendale risolve?
2. Componenti e architettura (teoria + pratica 3 ore).
Approcci classici alla progettazione del data warehouse
Componenti tipici e processi coinvolti
Concetti di Inmon, Kimball e DataVault
Panoramica delle principali componenti (stage, ods, dds, datamart, bi, metadata) e dei processi (ETL, ELT, DQ, lineage)
3. Gestione dei dati - Data Governance (teoria + pratica 2 ore).
Problematiche generali e specifiche della gestione dei dati aziendali
Le informazioni sono viste come una risorsa che apporta valore e il cui ottenimento comporta costi.
Il concetto di “dati anagrafici” e sistemi per la loro gestione - MDM
4. Tecniche di progettazione dello storage (teoria + pratica 5 ore).
Passaggi di progettazione dello storage
Tecniche e strumenti tipici per la creazione
Competenza dei partecipanti e delle infrastrutture
5. Area archiviazione dati sorgente - Stage (teoria + pratica 3 ore).
La necessità di archiviare dati grezzi dal sistema di origine
Errori tipici nell'organizzazione di quest'area e la sua differenza rispetto a un “data Lake”
6. Aree di deposito permanente - ODS e DDS (teoria + pratica 3 ore).
Livelli di archiviazione dei dati operativi e multidimensionali
Processi di estrazione, purificazione, controllo e conservazione - ETL\ELT
Trasformazione nello schema di archiviazione target
7. Sistemi di archiviazione dei dati che consumano (teoria + pratica 3,5 ore).
Scenari tipici per l'utilizzo dei dati dagli archivi
Principali consumatori - sistemi di business intelligence "BI"
La struttura di un tipico sistema BI e le ragioni della sua ampia varietà
8. Nuove sfide nello sviluppo di data warehouse (teoria + pratica 2 ore).
Una panoramica delle principali sfide che gli impianti di stoccaggio devono affrontare durante la loro crescita
Nuove sfide nel machine learning
Il concetto di Data Mesh come alternativa per ulteriori sviluppi.