Machine learning sui big data - corso gratuito da Open Education, formazione 5 settimane, da 5 a 14 ore settimanali, Data: 3 dicembre 2023.
Miscellanea / / December 08, 2023
Posizione: Crowd Solution Architect, Neatsy, Inc.
Ha iniziato a lavorare presso la Scuola Superiore di Economia nel 2017. Tiene corsi di alfabetizzazione digitale, analisi del testo e strumenti e tecniche per lavorare con grandi quantità di informazioni testuali. Interessi professionali: analisi di big data Formazione 2018 Laurea triennale: National Research University Higher School of Economics, specialità "Matematica applicata e informatica"
1. Preparazione dei dati per l'addestramento
Oggi, l’apprendimento automatico funziona in modo efficace quando disponiamo di grandi quantità di dati etichettati. Questa settimana esamineremo quali formati di dati e markup esistono e come questo markup può essere raccolto
2. Training di modelli classici sui big data
Questa settimana impareremo come addestrare algoritmi classici (modelli lineari e alberi decisionali) sui big data.
3. Costruire sistemi di raccomandazione
Vedremo come parallelizzare gli algoritmi classici utilizzati nei sistemi di raccomandazione.
4. Analisi di grandi volumi di informazioni testuali
Consideriamo i problemi di machine learning sui testi. Parliamo della preelaborazione del testo e di come ottenere una rappresentazione strutturata dei dati di testo utilizzando modelli come word2vec e BERT.
5. Addestramento di reti neurali profonde
Impareremo come parallelizzare l'addestramento delle moderne reti neurali, come funzionano Horovod e Parametro Server e parleremo di Transfer Learning.