Data Warehouse Analyst - corso gratuito da Otus, formazione 5 mesi, data 30 novembre 2023.
Miscellanea / / December 04, 2023
Le applicazioni analitiche oggi sono costruite all'intersezione delle pratiche di ingegneria (ingegneria del software/dati), comprensione delle specifiche dei prodotti e del business (analisi dei dati/business), fornitura rapida e di alta qualità dei servizi (DevOps).
Il corso mira a insegnare agli studenti come assemblare soluzioni analitiche end-to-end complete utilizzando gli strumenti più rilevanti e richiesti.
Il materiale sarà studiato sia in modo approfondito (ad esempio, i principi di funzionamento dei DBMS analitici) che in ampiezza (confronto di strumenti, analisi dei punti di forza e di debolezza delle soluzioni).
Quali cose nuove posso imparare?
Per i ruoli Data Scientist, Data Analyst, Product Analyst:
– Principi di funzionamento dei DBMS analitici e costruzione di condotte PFU
– Utilizzo delle migliori pratiche per modellare data warehouse e mart
– Applicazione dei modelli architettonici corretti durante la costruzione di soluzioni
Per i ruoli Data Engineer, Backend Developer, DBA, Amministratore di sistema:
– Pratiche di costruzione di soluzioni analitiche end-to-end
– Competenze applicate in visualizzazione, dashboarding, BI
– Concentrarsi sulla creazione di valore aziendale
Il corso riguarderà:
– Competenze nella costruzione di condotte PFU: Airflow, Nifi, Stitch
– Principi di funzionamento dei DBMS analitici: Redshift, Greenplum, Clickhouse
– Best practice per la modellazione dei dati: dbt, Data Vault
– Visualizzazione e BI: Metabase, Superset, DataLens
– Analisi avanzate: KPI, Funnel, Attribuzione di marketing, Coorte, RFM
– Pratiche DevOps: integrazione continua, azioni Github
6
corsiData engineer presso Wildberries, relatore del corso DE Junior. Più di 7 anni nel settore informatico
Laureato con lode all'Università statale di Voronezh. Attualmente studente del master HSE "System and Software Engineering". Esperienza professionale: 2 anni di lavoro come analista di dati e ingegnere di dati. Ora lavora con 5 database popolari, sviluppa in Python e sta rapidamente sviluppando le sue capacità. Pronto a condividere la mia esperienza.
1
BENEOltre 6 anni di esperienza nello sviluppo di data warehouse, pipeline PFU, analisi e visualizzazione dei dati. Esperienza nel campo della sicurezza statale, creazione e implementazione del "Gruppo di società "SBSV-Klyuchavto" KHD LLC, attualmente...
Oltre 6 anni di esperienza nello sviluppo di data warehouse, pipeline PFU, analisi e visualizzazione dei dati. Esperienza nel campo della sicurezza statale, creazione e implementazione del "Gruppo di società "SBSV-Klyuchavto" di QCD LLC, attualmente in fase di sviluppo di QCD per le aziende del gruppo Delo sono fiducioso che i dati siano il secondo petrolio, una sorta di patrimonio che bisogna saper gestire e smaltire. La presenza di dati organizzati, la loro corretta conservazione, utilizzo, vendita, anonimizzazione indicano un elevato livello di maturità digitale. Insegnante
3
corsoAlexandra lavora nel campo dell'analisi e della BI dal 2019. A questo punto, ha conseguito una laurea in ingegneria del software presso l'Università statale di amministrazione dell'aviazione di San Pietroburgo e poi un master. Primi passi in...
Alexandra lavora nel campo dell'analisi e della BI dal 2019. A questo punto, ha conseguito una laurea in ingegneria del software presso l'Università statale di amministrazione dell'aviazione di San Pietroburgo e poi un master. I primi passi della sua carriera sono stati mossi presso la società americana Intermedia Cloud Communications come analista di dati junior e nel 2021 è riuscito a diventare il capo del team di analisi. L'intero anno è stato dedicato ad un nuovo progetto cross-team per la gestione finanziaria internazionale sullo stack Microsoft (MS SQL Server, SSRS, SSIS, Power BI). Da marzo 2022 lavora nel gruppo di società Tinkoff Bank come analista di magazzino dati. Fornisce supporto al top management del dipartimento finanziario nella creazione di prototipi di processi ETL utilizzando Greenplum, analisi ad hoc in Python, reporting e visualizzazione in Tableau. Nel 2020 ha ricevuto una formazione aggiuntiva nella direzione di Project Management Manager in ambito IT. È un convinto sostenitore delle metodologie di sviluppo flessibili. Ritiene che gli investimenti più redditizi siano quelli nel proprio sviluppo. Stack: SQL, SAS DIS, SSIS, Tableau, Power BI, Python
ELT: Struttura e tipologia delle fonti dati
-Argomento 1. Fonti dei dati: classificazione e caratteristiche
-Argomento 2.Strumenti per il download dei dati – 1
-Argomento 3.Strumenti per il download dei dati – 2
Nozioni di base su DWH
-Argomento 4. Motori analitici (DBMS) per lavorare con i dati
-Argomento 5.Principi di costruzione DWH
-Argomento 6.Analisi DZ – Caricamento dati contatore web
-Argomento 7.Introduzione allo strumento di creazione dei dati
-Argomento 8.DBT: Ingegneria analitica
DWH Intermedio
-Argomento 9. Orchestrazione di script e compiti – 1
-Argomento 10. Orchestrazione di script e attività – 2
-Argomento 11.Analisi DZ – Configurazione e lancio del progetto dbt
-Argomento 12.Qualità dei dati
-Argomento 13. Problemi di ottimizzazione delle prestazioni
-Argomento 14.Archivio dati – 1
-Argomento 15.Archivio dati – 2
-Argomento 16.Analisi DZ – Preparazione e impostazione di una pianificazione DAG per il download dei dati dalle fonti
Intelligenza aziendale
-Argomento 17.BI: Panoramica
-Argomento 18.BI: Distribuzione
-Argomento 19.BI: Modellazione e consegna
-Argomento 20.Analisi DZ – Organizzazione di uno strato DWH dettagliato utilizzando la metodologia Data Vault
-Argomento 21.Analitica: vetrine analitiche di base
-Argomento 22.BI: Domande approfondite
-Argomento 23. DZ Razor – Configurazione e implementazione di una soluzione BI
-Argomento 24.Analisi: vetrine di analisi avanzate
DWH Argomenti avanzati
-Argomento 25.DWH: Argomenti avanzati
-Argomento 26.DBT: Ampliamento con moduli
-Argomento 27.DWH: Monitoraggio + Gestione del carico di lavoro
-Argomento 28.Analisi DZ – Visualizzazione e dashboarding per vetrine analitiche
-Argomento 29.DWH: Dati esterni + semistrutturati
-Argomento 30.DWH: Reverse-ETL
-Argomento 31.DWH: Capacità di machine learning
Ricapitolare
-Argomento 32. Analisi del caso: soluzione end-to-end
-Argomento 33.Analisi DZ – DWH avanzato: configurazione CI, moduli dbt, tabelle esterne
-Argomento 34. Ulteriore sviluppo delle competenze
Lavoro di progetto
-Argomento 35. Selezione dell'argomento e organizzazione del lavoro del progetto
-Tema 36. Tutela dell'opera di progettazione