Corso "Specialista in scienza dei dati" - corso 112.000 rubli. da Yandex Workshop, formazione 8 mesi, data 30 novembre 2023.
Miscellanea / / November 28, 2023
Cosa fanno i Data Scientist?
Analizza grandi quantità di dati, sviluppa modelli e applica il machine learning per fare previsioni e identificare modelli. Sono necessari in varie aree in cui è necessario archiviare ed elaborare i dati.
Nelle banche
Analizza i dati sui clienti e determina quali indicatori influenzano la loro affidabilità creditizia, prevede la probabilità che il cliente lasci la banca
Nell'industria
Utilizzando l’apprendimento automatico, prevedono quando le apparecchiature falliranno e in quale deposito il mining porterà il profitto maggiore.
Nel marketing e nel commercio
Aiutano a trovare punti di crescita analizzando la stagionalità, i giorni di punta delle vendite e creando un sistema di consigli
Nel settore dei trasporti
Ottimizza il funzionamento dei semafori, valuta il carico sulle strade e aiuta ad adattare i piani di riparazione
Programma completo del corso in Data Science
Lo aggiorniamo regolarmente per garantire che soddisfi le esigenze del settore e dei datori di lavoro. In altre parole, impari solo ciò che ti sarà sicuramente utile nel tuo lavoro.
Nozioni di base su Python e analisi dei dati: corso introduttivo gratuito:
Impara i concetti di base dell'analisi dei dati e comprendi cosa fanno gli analisti e i data scientist. Risolvi cinque casi di lavoro con dati provenienti da aree diverse:
- scoprire il motivo del massiccio guasto dei gadget,
- verificare il ritorno dell'investimento pubblicitario sulle applicazioni mobili,
- trovare la posizione migliore per un nuovo negozio,
- aiutarti a scegliere una strategia di sviluppo per una startup AI,
- valutare l'efficacia dei robot nel servizio di supporto.
Risolvendo i casi, imparerai le basi di Python e della libreria pandas, imparerai a costruire alcuni grafici e ad interpretarli correttamente.
Introduzione alla professione di “Data Science Specialist”
Cos'è uno specialista in scienza dei dati?
Come insegniamo.
Pitone di base:
Immergiti più a fondo nel linguaggio di programmazione Python e nella libreria panda.
+1 progetto in portafoglio
Confronta i dati utente Yandex. Musica per città e giorno della settimana.
Preelaborazione dei dati:
Impara a pulire i dati da valori anomali, omissioni e duplicati, nonché a convertire diversi formati di dati.
+1 progetto in portafoglio
Analizzare i dati sui clienti bancari e determinare la quota di quelli solvibili.
Analisi esplorativa dei dati:
Imparare le basi della probabilità e della statistica. Usali per esplorare le proprietà di base dei dati, cercando modelli, distribuzioni e anomalie. Conosci le librerie scipy e matplotlib. Disegna diagrammi ed esercitati ad analizzare i grafici.
+1 progetto in portafoglio
Esplora l'archivio degli annunci per la vendita di immobili a San Pietroburgo e nella regione di Leningrado.
Teoria della probabilità. Corso aggiuntivo
Ricordare o riconoscere i termini base della teoria della probabilità: eventi indipendenti, opposti, incompatibili, ecc. Usando semplici esempi e problemi divertenti, ti eserciterai a lavorare con i numeri e a costruire la logica delle soluzioni.
Questo è uno sprint facoltativo. Ciò significa che ogni studente sceglie personalmente una delle opzioni:
- Segui un corso aggiuntivo di dieci brevi lezioni, rispolvera la teoria e risolvi i problemi.
- Apri solo il blocco con compiti di intervista, ricorda la pratica senza teoria.
- Salta completamente il corso o ritornaci quando c'è tempo e necessità.
Progetto finale del primo modulo
Impara come condurre ricerche preliminari sui dati e formulare e testare ipotesi.
+1 progetto in portafoglio
Trova modelli che determinano il successo del gioco.
Introduzione all'apprendimento automatico:
Padroneggia i concetti di base del machine learning. Conosci la libreria Scikit-Learn e usala per creare il tuo primo progetto di machine learning.
+1 progetto in portafoglio
Sviluppare un sistema di raccomandazione tariffaria per un operatore di telefonia mobile.
Formazione tutorata:
Immergiti più a fondo nell'area più calda del machine learning: l'apprendimento supervisionato. Scopri come gestire dati sbilanciati.
+1 progetto in portafoglio
Prevedere la probabilità che un cliente lasci la banca.
L’apprendimento automatico nel mondo degli affari:
Scopri come funziona il machine learning (abbr. MO) aiuta l'azienda su come raccogliere dati e su come le metriche del prodotto si collegano alle metriche MO. Impara a lanciare nuove funzionalità del servizio utilizzando il machine learning. Scopri cosa sono le metriche aziendali, i KPI e i test A/B.
+1 progetto in portafoglio
Formare un modello che aiuti a identificare un nuovo luogo per la produzione di petrolio con il minor rischio di perdite.
Progetto finale del secondo modulo:
Preparare i dati per l'apprendimento automatico. Utilizzando il modello, valutarne la qualità.
+1 progetto in portafoglio
Simula il processo di fusione del minerale d'oro per migliorare il funzionamento dell'impresa.
Algebra lineare:
Dai un'occhiata ad alcuni degli algoritmi che hai imparato finora e ottieni una migliore comprensione di come utilizzarli. In pratica, padroneggia da zero i principali concetti dell'algebra lineare: spazi lineari, operatori lineari, spazi euclidei.
+1 progetto in portafoglio
Utilizza il metodo di conversione dei dati per proteggere le informazioni personali dei clienti delle compagnie assicurative.
Metodi numerici:
Analizzerai una serie di algoritmi e li adatterai per risolvere problemi pratici utilizzando metodi numerici. Padroneggia calcoli approssimativi, stime della complessità degli algoritmi e discesa del gradiente. Scopri come vengono addestrate le reti neurali e cos'è il gradient boosting.
+1 progetto in portafoglio
Sviluppare un modello per determinare il costo di un'auto usata.
Serie temporali:
Le serie temporali descrivono come parametri, come il consumo di elettricità o il numero di ordini di taxi, cambiano nel tempo. Imparerai ad analizzare le serie, cercare tendenze e identificare la stagionalità. Scopri come creare dati tabulari e un problema di regressione delle serie temporali.
+1 progetto in portafoglio
Costruisci un modello e prevedi i picchi di carico dei taxi.
Machine learning per i testi:
Impara a creare vettori numerici dai testi e risolvi problemi di classificazione e regressione per essi. Scopri come vengono calcolate le caratteristiche TF-IDF e acquisisci familiarità con le rappresentazioni linguistiche word2vec e BERT.
+1 progetto in portafoglio
Accelera la moderazione dei commenti nella tua comunità automatizzando le valutazioni della tossicità.
SQL di base:
Impara le basi del linguaggio di query SQL e dell'algebra relazionale per lavorare con i database. Familiarizza con le funzionalità di lavorare in PostgreSQL, un popolare sistema di gestione di database (abbr. DBMS). Impara a scrivere query di vari livelli di complessità e a tradurre i problemi aziendali in SQL.
Lavorerai con un database di un negozio online specializzato in film e musica.
+1 progetto in portafoglio
Scrivi una serie di query di varia complessità in un database che memorizza i dati su investitori di venture capital, startup e investimenti in essi.
Visione computerizzata:
Impara a risolvere semplici problemi di visione artificiale utilizzando reti neurali già pronte e la libreria Keras. Scopri il deep learning.
+1 progetto in portafoglio
Costruisci un modello per determinare l'età approssimativa di una persona da una fotografia.
Apprendimento non supervisionato:
L'apprendimento non supervisionato è uno dei metodi di apprendimento automatico in cui il sistema risolve un problema senza dati pre-etichettati in base alle sue caratteristiche e struttura. Informazioni sui problemi di clustering e rilevamento di anomalie.
Progetto di diploma:
Nell'ultimo progetto, conferma di aver padroneggiato una nuova professione. Chiarisci il compito del cliente e attraversa tutte le fasi di analisi dei dati e apprendimento automatico. Ora non ci sono lezioni né compiti a casa: tutto è come in un vero lavoro.
+1 progetto in portafoglio
Progetto tra cui scegliere:
- Costruire un modello che preveda l'abbandono dei clienti da una società di telecomunicazioni.
- Costruire un modello che preveda i parametri del processo tecnologico in un impianto metallurgico.
D
daryamannannikova
01.10.2020 G.
Esempio di corsi online ideali
In Yandex. Durante il workshop studio la professione di DataScience, una direzione abbastanza di moda ora, e come si è scoperto, è piuttosto difficile, come si suol dire, difficile da imparare - facile da combattere. (adsbygoogle = window.adsbygoogle || []).push({}); Ci sono state molte difficoltà sul mio cammino, non avevo abbastanza tempo (mi diplomavo e lavoravo), la forza di comprendere le statistiche periodicamente mi abbandonava, il coronavirus ci chiudeva tutti a casa...
S
sergen355
14.07.2021 G.
Ottimo progetto educativo
Vantaggi: proprio simulatore, revisioni di progetti, consulenze, community in Slack, aiuto su ogni problema. Svantaggi: l'unico aspetto negativo è che in alcuni argomenti non c'è materiale completo nel simulatore, è necessario tempo aggiuntivo per cercare informazioni in modo indipendente, ho studiato alla Facoltà di Scienze dei dati. Buon formato formativo. Alcuni entrano, altri no. Ma per me questo è il massimo...