Data Science - corso gratuito della Scuola di Analisi dei Dati, formazione 4 semestri, data del 2 dicembre 2023.
Miscellanea / / December 05, 2023
Per chi vuole porre problemi utilizzando l'analisi dei dati, proporre soluzioni e valutarne l'efficacia non solo in un esperimento sintetico, ma anche in condizioni reali.
Statistica, apprendimento automatico e lavoro con diversi tipi di dati.
I dati sono alla base della maggior parte dei servizi e dei prodotti moderni, dalle app per le previsioni meteorologiche alle auto a guida autonoma. Un Data Scientist conduce esperimenti, costruisce metriche, sa ottimizzare il funzionamento dei servizi e capisce dove sono i loro punti di crescita.
Ogni studente deve completare con successo almeno tre corsi durante il semestre. Ad esempio, se ce ne sono due nel programma principale, devi scegliere uno dei corsi speciali.
La conoscenza viene verificata principalmente attraverso i compiti: esami e test vengono condotti solo in alcune materie.
Primo semestre
Obbligatorio
Algoritmi e strutture dati, parte 1
01.Complessità e modelli computazionali. Analisi dei valori contabili (inizio)
02.Analisi dei valori contabili (fine)
03.Algoritmi Merge-Sort e Quick-Sort
04. Statistica ordinale. Cumuli (inizio)
05. Cumuli (fine)
06.Hashing
07.Alberi di ricerca (inizio)
08.Alberi di ricerca (continua)
09.Cerca alberi (fine). Sistema di insiemi disgiunti
10. Compiti RMQ e LCA
11.Strutture dati per la ricerca geometrica
12.Il problema della connettività dinamica in un grafo non orientato
Linguaggio Python
01. Nozioni di base sulla lingua (Parte 1)
02. Nozioni di base sulla lingua (Parte 2)
03.Programmazione orientata agli oggetti
04.Gestione degli errori
05. Progettazione e test del codice
06.Lavorare con le corde
07.Modello di memoria
08Programmazione funzionale
09.Revisione della biblioteca (parte 1)
10. Revisione della biblioteca (parte 2)
11.Calcolo parallelo in Python
12.Lavoro avanzato con gli oggetti
Apprendimento automatico, parte 1
01.Concetti di base ed esempi di problemi applicati
02.Metodi di classificazione metrica
03.Metodi di classificazione logica e alberi decisionali
04.Metodi di classificazione lineare dei gradienti
05.Supporto macchina vettoriale
06.Regressione lineare multivariata
07.Regressione non lineare e non parametrica, funzioni di perdita non standard
08.Previsione delle serie temporali
09.Metodi di classificazione bayesiana
10.Regressione logistica
11.Cerca le regole di associazione
Secondo termine
Obbligatorio
Fondamenti di statistica nell'apprendimento automatico
01.Introduzione
02.Principali compiti e metodi della teoria dell'inferenza statistica
03. Stima della distribuzione e funzionali statistici
04.Simulazione Monte Carlo, bootstrap
05.Stima parametrica
06. Verifica di ipotesi
07. Riduzione della dimensionalità dei dati multidimensionali
08.Valutazione della sensibilità del modello
09.Regressione lineare e logistica
10.Metodi di progettazione degli esperimenti
11.Vari tipi di regolarizzazione nella regressione lineare
12. Metodi non lineari per costruire dipendenze di regressione
13.Stima non parametrica
14.Approccio bayesiano alla stima
15.Approccio bayesiano alla regressione
16. Approccio bayesiano alla regressione e all'ottimizzazione
17.Utilizzo del modello del campo gaussiano casuale in problemi di analisi dei dati
18.Utilizzo di modelli e metodi statistici nella modellazione surrogata e in problemi di ottimizzazione
Apprendimento automatico, parte 2
01.Metodi di classificazione e regressione delle reti neurali
02.Metodi compositivi di classificazione e regressione
03.Criteri di scelta dei modelli e modalità di scelta delle caratteristiche
04.Classifica
05.Apprendimento per rinforzo
06.Apprendere senza insegnante
07.Problemi con l'allenamento parziale
08.Filtraggio collaborativo
09. Modellazione degli argomenti
Terzo semestre
Scegliere da
Elaborazione automatica del testo
01Materiale del corso
O
Visione computerizzata
Il corso è dedicato ai metodi e agli algoritmi della visione artificiale, ovvero. estrarre informazioni da immagini e video. Diamo un'occhiata alle basi dell'elaborazione delle immagini, della classificazione delle immagini, della ricerca delle immagini per contenuto, del riconoscimento dei volti, della segmentazione delle immagini. Poi parleremo degli algoritmi di elaborazione e analisi video. L'ultima parte del corso è dedicata alla ricostruzione 3D. Per la maggior parte dei problemi discuteremo i modelli di rete neurale esistenti. Nel corso cerchiamo di prestare attenzione solo ai metodi più moderni attualmente utilizzati per risolvere problemi pratici e di ricerca. Il corso è in gran parte pratico piuttosto che teorico. Pertanto, tutte le lezioni sono dotate di laboratorio e compiti a casa, che consentono di provare nella pratica la maggior parte dei metodi discussi. Il lavoro viene eseguito in Python utilizzando varie librerie.
01.Immagine digitale e correzione tonale.
02.Nozioni di base sull'elaborazione delle immagini.
03.Combinazione di immagini.
04. Classificazione delle immagini e ricerca di immagini simili.
05. Reti neurali convoluzionali per la classificazione e la ricerca di immagini simili.
06.Rilevamento oggetti.
07. Segmentazione semantica.
08.Trasferimento di stili e sintesi di immagini.
09.Riconoscimento video.
10.Ricostruzione 3D sparsa.
11.Ricostruzione tridimensionale densa.
12.Ricostruzione da un fotogramma e nuvole di punti, modelli parametrici.
Quarto semestre
Corsi speciali consigliati
Apprendimento approfondito
01.Materiale del corso
Insegnamento rafforzativo
01.Materiale del corso
Auto a guida autonoma
Il corso copre i componenti principali della tecnologia di guida autonoma: localizzazione, percezione, previsione, livello comportamentale e pianificazione del movimento. Per ciascuna componente verranno descritti gli approcci principali. Inoltre, gli studenti acquisiranno familiarità con le attuali condizioni di mercato e le sfide tecnologiche.
01.Panoramica dei principali componenti e sensori di un veicolo senza pilota. Livelli di autonomia. Guida tramite filo. L’auto a guida autonoma come prodotto aziendale. Modi per valutare i progressi nella creazione di droni. Nozioni di base sulla localizzazione: gnss, odometria delle ruote, filtri bayesiani.
02.Metodi di localizzazione lidar: ICP, NDT, LOAM. Introduzione allo SLAM visivo utilizzando ORB-SLAM come esempio. Enunciato del problema GraphSLAM. Riduzione del problema GraphSLAM a un metodo dei minimi quadrati non lineare. Selezionare la parametrizzazione corretta. Sistemi con struttura speciale in GraphSLAM. Approccio architetturale: frontend e backend.
03. Compito di riconoscimento in un'auto a guida autonoma. Ostacoli statici e dinamici. Sensori per il sistema di riconoscimento. Rappresentazione di ostacoli statici. Rilevamento di ostacoli statici tramite lidar (VSCAN, metodi di rete neurale). Utilizzo di lidar insieme alle immagini per rilevare la statica (segmentazione semantica delle immagini, completamento della profondità). Fotocamera stereo e acquisizione della profondità da un'immagine. Il mondo Stixel.
04.Immaginare ostacoli dinamici in un'auto a guida autonoma. Metodi di rete neurale per il rilevamento di oggetti in 2D. Rilevamento basato sulla vista Bird-eye della rappresentazione della nuvola lidar. Utilizzo del lidar con immagini per rilevare ostacoli dinamici. Rilevamento auto in 3D basato su immagini (montaggio di scatole 3D, modelli CAD). Rilevamento dinamico degli ostacoli basato su radar. Tracciamento degli oggetti.
05.Schemi di guida dell'auto: ruota posteriore, ruota anteriore. Pianificazione del percorso. Il concetto di spazio delle configurazioni. Metodi grafici per la costruzione di traiettorie. Traiettorie che riducono al minimo il jerk. Metodi di ottimizzazione per la costruzione di traiettorie.
06.Pianificazione della velocità in un ambiente dinamico. Pianificazione ST. Prevedere il comportamento degli altri utenti della strada.