Data Scientist da zero a PRO - corso RUB 233.640. da SkillFactory, formazione 24 mesi, data 15 agosto 2023.
Miscellanea / / November 29, 2023
Dopo il corso base, potrai scegliere una specializzazione più ristretta in Data Science: ML Engineer, CV Engineer o NLP Engineer
Ingegnere M.L — Sviluppatore di machine learning
Sviluppare un modello di previsione del rating del credito
Risolvi il problema della classificazione dei messaggi SMS di spam
Sviluppare un sistema per consigliare prodotti idonei al momento dell'acquisto
Costruire un modello per aumentare le vendite nel commercio al dettaglio
Crea immagini basate sulla descrizione testuale utilizzando la rete neurale DALL-E
Ingegnere CV — Specialista in visione artificiale
Impara a risolvere tutti i problemi di base nel campo della Computer Vision
Acquisirai la conoscenza del flusso reale del lavoro con modelli CV, approcci attuali e strumenti avanzati necessari per creare servizi CV
Nel progetto finale, creare un coach virtuale in grado di valutare la correttezza degli esercizi in video
Ingegnere della PNL — Specialista nell'elaborazione del linguaggio naturale
Scopri l'elaborazione del linguaggio naturale
Acquisisci una comprensione delle attività della PNL: classificazione, riepilogo e generazione di testo, creazione di sistemi per la traduzione automatica e sistemi di risposta alle domande
Nel progetto finale, svilupperai in modo indipendente strumenti per la ricerca automatizzata di contesti su determinati argomenti.
BASE
In questa fase imparerai le basi della programmazione in Python, imparerai come preelaborare e analizzare i dati e acquisirai familiarità con i compiti principali di un data scientist.
Introduzione - 1 settimana
Potrai formulare veri e propri obiettivi di apprendimento, scoprire qual è il valore del DS per il business, conoscere i compiti principali di un data scientist e comprendere come svilupparli progetto DS.
INTRO-1. Come studiare in modo efficace: integrazione nella formazione
INTRO-2. Panoramica della professione. Tipi di problemi nella scienza dei dati. Fasi e approcci per sviluppare un progetto di Data Science
Progettazione dello sviluppo - 5 settimane
Imparerai a lavorare con tipi di dati di base utilizzando Python e sarai in grado di utilizzare costrutti di loop, istruzioni condizionali e funzioni nel tuo lavoro quotidiano.
PITONE-1. Nozioni di base su Python
PITONE-2. Immersione nei tipi di dati
PITONE-3. Dichiarazioni condizionali
PYTHON-4. Cicli
PYTHON-5. Funzioni e programmazione funzionale
PYTHON-6. Pratica
PYTHON-7. Guida allo stile Python (bonus)
Matematica di base - 7 settimane
MATEMATICA-1. Numeri ed espressioni
MATEMATICA-2. Equazioni e disuguaglianze
MATEMATICA-3. Concetti di base della teoria delle funzioni
MATEMATICA-4. Nozioni di base di geometria: planimetria, trigonometria e stereometria
MATEMATICA-5. Insiemi, logica ed elementi di statistica
MATEMATICA-6. Combinatoria e fondamenti di teoria della probabilità
MATEMATICA-7. Risoluzione dei problemi
Lavorare con i dati - 8 settimane
In questa fase acquisirai padronanza delle competenze di base sui dati: come preparare, pulire e trasformare i dati in modo che siano adatti per l'analisi. A proposito di analisi: analizzerai i dati utilizzando le popolari librerie Matplotlib, Seaborn, Plotly.
PYTHON-8. Strumenti di scienza dei dati
PITONE-9. Libreria NumPy
PYTHON-10. Introduzione ai Panda
PYTHON-11. Tecniche di base per lavorare con i dati in Panda
PYTHON-12. Tecniche avanzate di dati nei Panda
PYTHON-13. Pulizia dei dati
PYTHON-14. Visualizzazione dati
PITONE-15. Principi di OOP in Python e codice di debug (modulo opzionale)
Progetto 1. Analisi dei set di dati su questioni chiuse
Caricamento dati - 6 settimane
Potrai scaricare dati da diversi formati e fonti. E SQL, un linguaggio di query strutturato, ti aiuterà in questo. Imparerai a utilizzare funzioni di aggregazione, join di tabelle e join complessi.
PYTHON-16. Come scaricare dati da file di diversi formati
PYTHON-17. Recupero di dati da origini Web e API
SQL-0. Ciao SQL!
SQL-1. Nozioni di base su SQL
SQL-2. Funzioni aggregate
SQL-3. Unione di tabelle
SQL-4. Join complessi
Progetto 2. Caricamento nuovi dati. Affinare l'analisi
Analisi dei dati statistici - 7 settimane
L'Intelligence Data Analysis (EDA) è ciò che sarà il tuo focus. Acquisirai familiarità con tutte le fasi di tale analisi e imparerai come condurla utilizzando le librerie Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Inoltre, potrai lavorare su Kaggle, un popolare servizio per partecipare alle competizioni.
EDA-1. Introduzione all'analisi dei dati di intelligence. Algoritmi e metodi EDA
EDA-2. Statistica matematica nel contesto dell'EDA. Tipi di funzionalità
EDA-3. Ingegneria delle caratteristiche
EDA-4. Analisi statistica dei dati in Python
EDA-5. Analisi statistica dei dati in Python. Parte 2
EDA-6. Progettazione di esperimenti
EDA-7. Piattaforma Kaggle
Progetto 2
Introduzione al Machine Learning - 9 settimane
Acquisirai familiarità con le librerie ML per la modellazione delle dipendenze dei dati. Sarai in grado di addestrare i principali tipi di modelli ML, eseguire la convalida, interpretare i risultati del lavoro e selezionare funzionalità importanti (importanza delle funzionalità).
ML-1. Teoria dell'apprendimento automatico
ML-2. Apprendimento supervisionato: regressione
ML-3. Apprendimento supervisionato: classificazione
ML-4. Apprendimento non supervisionato: tecniche di clustering e riduzione della dimensionalità
ML-5. Validazione dei dati e valutazione del modello
ML-6. Selezione e selezione dei tratti
ML-7. Ottimizzazione degli iperparametri del modello
ML-8. Libro di cucina ML
Progetto 3. Problema di classificazione
UNITÀ PRINCIPALE
Algebra lineare, analisi matematica, matematica discreta: sembra spaventoso, ma non aver paura: analizzeremo tutti questi argomenti e ti insegneremo come lavorarci! Nella seconda fase, ti immergerai nella matematica e nelle basi dell'apprendimento automatico, imparerai di più sulle professioni DS e, attraverso l'orientamento professionale, selezionerai un percorso di studi del secondo anno.
Matematica e apprendimento automatico. Parte 1 - 6 settimane
Sarai in grado di risolvere problemi pratici utilizzando il calcolo manuale e Python (calcoli vettoriali e matriciali, lavoro con insiemi, studio di funzioni utilizzando l'analisi differenziale).
MATEMATICA&ML-1. Algebra lineare nel contesto dei metodi lineari. Parte 1
MATEMATICA&ML-2. Algebra lineare nel contesto dei metodi lineari. Parte 2
MATEMATICA&ML-3. Analisi matematica nel contesto di un problema di ottimizzazione Parte 1
MATEMATICA&ML-4. Analisi matematica nel contesto di un problema di ottimizzazione. Parte 2
MATEMATICA&ML-5. Analisi matematica nel contesto di un problema di ottimizzazione. Parte 3
Progetto 4. Problema di regressione
Matematica e apprendimento automatico. Parte 2 - 6 settimane
Acquisirai familiarità con i concetti di base della teoria della probabilità e della statistica matematica, degli algoritmi clustering e imparare anche a valutare la qualità del clustering eseguito e a presentare i risultati forma grafica.
MATEMATICA&ML-6. Teoria della probabilità nel contesto di un classificatore Naive Bayes
MATEMATICA&ML-7. Algoritmi basati su alberi decisionali
MATEMATICA&ML-8. Potenziamento e impilamento
MATEMATICA&ML-9. Tecniche di clustering e riduzione della dimensionalità. Parte 1
MATEMATICA&ML-10. Tecniche di clustering e riduzione della dimensionalità. Parte 2
Progetto 5. Metodi d'insieme
Matematica Discreta - 4 settimane
MATH&MGU-1 Insiemi e calcolo combinatorio
MATEMATICA&MGU-2 Logica
MATH&MGU-3 Grafici. Parte 1
MATH&MGU-4 Grafici. Parte 2
ML nel mondo degli affari - 8 settimane
Imparerai a utilizzare le librerie ML per risolvere problemi di serie temporali e sistemi di raccomandazione. Sarai in grado di addestrare un modello ML e convalidarlo, nonché creare un prototipo funzionante ed eseguire il modello nell'interfaccia web. E acquisisci anche capacità di test A/B in modo da poter valutare il modello.
MATEMATICA&ML-11. Serie temporali. Parte 1
MATEMATICA&ML-12. Serie temporali. Parte 2
MATEMATICA&ML-13. Sistemi di raccomandazione. Parte 1
MATEMATICA&ML-14. Sistemi di raccomandazione. Parte 2
PROD-1. Preparazione del modello per la produzione
PROD-2. PrototipoStreamlit+Heroku
PROD-3. Comprensione aziendale. Caso
Progetto 6. Argomento tra cui scegliere: serie temporali o sistemi di raccomandazione
LIVELLO PRO
Nella terza fase acquisirai familiarità con uno dei metodi di apprendimento automatico: il deep learning (DL). E ti aspetta anche un blocco a tutti gli effetti della specializzazione scelta: potrai padroneggiare le capacità di apprendimento automatico (ML), familiarizzare con la routine del CV (visione artificiale) o migliorare la PNL*, l'elaborazione naturale lingua.
Secondo anno di studio: 3 specializzazioni tra cui scegliere
Orientamento professionale
ML, CV o PNL: in questa fase devi finalmente fare una scelta su quale strada intraprendere. Ti parleremo di ogni specializzazione e ti offriremo la soluzione di diversi problemi pratici per renderti più facile la decisione.
Traccia ML - ingegnere
Nel percorso ML imparerai a risolvere problemi approfonditi di machine learning, a padroneggiare le competenze di un ingegnere di dati e ad affinare le tue capacità di lavorare con le librerie Python. Imparerai anche come creare un MVP (versione minima valida di un prodotto), apprenderai tutte le complessità dell'output di un modello ML in produzione e imparerai come lavorano gli ingegneri ML nella vita reale.
Introduzione all'apprendimento profondo
Nozioni di base sull'ingegneria dei dati
Capitoli aggiuntivi su Python e ML
Valutazione economica degli effetti e sviluppo dell'MVP
ML alla produzione
Studio approfondito del progetto di sviluppo e laurea in ML su un argomento scelto
Traccia CV - ingegnere
Nel percorso CV imparerai a risolvere problemi di visione artificiale come la classificazione delle immagini, segmentazione e rilevamento, generazione e stilizzazione di immagini, restauro e miglioramento della qualità fotografie. Inoltre, imparerai come implementare le reti neurali nella produzione.
Introduzione all'apprendimento profondo
Nozioni di base sull'ingegneria dei dati
Capitoli aggiuntivi su Python e ML
Valutazione economica degli effetti e sviluppo dell'MVP
ML alla produzione
Studio approfondito del progetto di sviluppo e laurea in ML su un argomento scelto
Traccia PNL - ingegnere
Durante la formazione sul percorso PNL, imparerai come risolvere i principali problemi dell'elaborazione del linguaggio naturale, in compresa la classificazione, il riepilogo e la generazione di testi, la traduzione automatica e la creazione di dialoghi sistemi
Introduzione all'apprendimento profondo
Matematica delle reti neurali per la PNL
Hard e software per risolvere problemi di PNL
Compiti e algoritmi della PNL
Reti neurali in produzione
Studio approfondito dello sviluppo della PNL e progetto di laurea su un argomento scelto
Se scegli la specializzazione CV o ML, puoi seguire gratuitamente il corso di PNL senza il supporto di un tutor.
Deep Learning e reti neurali
Dove vengono utilizzate le reti neurali? Come addestrare una rete neurale? Cos'è l'apprendimento profondo? Troverai le risposte a queste domande nella sezione bonus di DL.
Introduzione all'ingegneria dei dati
Imparerai la differenza tra i ruoli di un data scientist e di un data engineer, quali strumenti utilizza quest'ultimo nel suo lavoro e quali compiti risolve quotidianamente. Le parole “fiocco di neve”, “stella” e “lago” assumeranno nuovi significati :)