Matematica e apprendimento automatico per la scienza dei dati - corso RUB 50.040. da SkillFactory, formazione 5,5 mesi, data: 13 agosto 2023.
Miscellanea / / November 29, 2023
Potrai studiare da qualsiasi parte del mondo. I nuovi moduli verranno aperti una volta alla settimana. Contenuti appositamente progettati e materiali aggiuntivi ti aiuteranno a comprendere l'argomento.
La pratica si compone di tre parti: esecuzione di semplici esercizi di calcolo; eseguire esercizi basati su Python; risolvere problemi di vita nel campo dell'analisi, della previsione e dell'ottimizzazione dei dati.
Comunicherai costantemente con i tuoi compagni studenti nei canali Slack privati. Se non capisci qualcosa o non riesci a far fronte a un compito, ti aiuteremo a capirlo.
Alla fine del corso ti verrà assegnato un compito speciale in cui potrai applicare tutte le competenze acquisite e confermare il tuo successo nell'apprendimento della materia.
Programma del corso di matematica
Parte 1 - Algebra lineare
- Studiamo vettori e tipi di matrici
- Imparare a eseguire operazioni sulle matrici
- Determinazione della dipendenza lineare mediante matrici
- Studiamo matrici inverse, singolari e non singolari
- Studiamo sistemi di equazioni lineari, autonomi e numeri complessi
- Padroneggiare la matrice e la scomposizione singolare
- Risoluzione di problemi di dipendenza lineare mediante matrici
- Ottimizzazione utilizzando il metodo delle componenti principali
- Rafforzare le basi matematiche della regressione lineare
Parte 2 - Nozioni di base di analisi matematica
- Studiamo funzioni di una e più variabili e derivate
- Padroneggiare il concetto di gradiente e discesa del gradiente
- Formazione su problemi di ottimizzazione
- Studiamo il metodo del moltiplicatore di Lagrange, il metodo di Newton e la ricottura simulata
- Risolviamo problemi di previsione e ricerca di una strategia vincente utilizzando metodi derivativi e di ottimizzazione numerica
- Rafforzamento dei calcoli dietro la discesa del gradiente e la ricottura simulata
Parte 3 - Fondamenti di probabilità e statistica
- Studiamo i concetti generali della statistica descrittiva e matematica
- Padroneggiare la combinatoria
- Studiamo i principali tipi di distribuzioni e correlazioni
- Comprendere il teorema di Bayes
- Imparare un classificatore Naive Bayes
- Risolviamo problemi di combinatoria, validità e previsione utilizzando la statistica e la teoria della probabilità
- Consolidiamo le basi matematiche della classificazione e della regressione logistica
Parte 4 - Serie storiche e altri metodi matematici
- Presentazione dell'analisi delle serie temporali
- Padroneggiare tipi di regressioni più complessi
- Previsione del budget tramite serie storiche
- Rafforzare le basi matematiche dei classici modelli di machine learning
Programma del corso breve sul Machine Learning
Assistenza del tutor durante la formazione
Modulo 1 - Introduzione al Machine Learning
Conosciamo i principali compiti e metodi dell'apprendimento automatico, studiamo casi pratici e applichiamo l'algoritmo di base per lavorare su un progetto ML
Risolviamo oltre 50 problemi per rafforzare l'argomento
Modulo 2 - Metodi di preelaborazione dei dati
Studiamo i tipi di dati, impariamo a pulire e arricchire i dati, utilizziamo la visualizzazione per la preelaborazione e padroneggiamo l'ingegneria delle funzionalità
Risolviamo oltre 60 problemi per rafforzare l'argomento
Modulo 3 - Regressione
Padroneggiamo la regressione lineare e logistica, studiamo i limiti di applicabilità, inferenza analitica e regolarizzazione. Modelli di regressione dell'addestramento
Risolviamo oltre 40 problemi per rafforzare l'argomento
Modulo 4 - Clustering
Padroneggiamo l'apprendimento senza insegnante, pratichiamo i suoi vari metodi, lavoriamo con testi utilizzando ML
Risolviamo oltre 50 problemi per rafforzare l'argomento
Modulo 5 - Algoritmi basati sugli alberi: introduzione agli alberi
Facciamo conoscenza con gli alberi decisionali e le loro proprietà, padroneggiamo gli alberi della libreria Sklearn e usiamo gli alberi per risolvere un problema di regressione
Risolviamo oltre 40 problemi per rafforzare l'argomento
Modulo 6 - Algoritmi basati sugli alberi: insiemi
Studiamo le caratteristiche degli insiemi di alberi, pratichiamo il potenziamento, utilizziamo l'insieme per costruire la regressione logistica
Risolviamo oltre 40 problemi per rafforzare l'argomento
Stiamo partecipando a un concorso su Kaggle per l'addestramento di un modello basato sugli alberi
Modulo 7 - Valutare la qualità degli algoritmi
Studiamo i principi della suddivisione del campione, dell'underfitting e dell'overfitting, valutiamo i modelli utilizzando varie metriche di qualità, impariamo a visualizzare il processo di apprendimento
Valutazione della qualità di diversi modelli ML
Risolviamo oltre 40 problemi per rafforzare l'argomento
Modulo 8 - Serie temporali nell'apprendimento automatico
Facciamo conoscenza con l'analisi delle serie temporali in ML, padroneggiamo i modelli lineari e XGBoost, studiamo i principi della convalida incrociata e della selezione dei parametri
Risolviamo oltre 50 problemi per rafforzare l'argomento
Modulo 9 - Sistemi di raccomandazione
Studiamo metodi per costruire sistemi di raccomandazione, padroneggiamo l'algoritmo SVD, valutiamo la qualità delle raccomandazioni del modello addestrato
Risolviamo oltre 50 problemi per rafforzare l'argomento
Modulo 10 - Hackathon finale
Applichiamo tutti i metodi studiati per ottenere la massima accuratezza delle previsioni del modello su Kaggle