Big Data e Data Science: passa al livello successivo - corso gratuito di Stepik, formazione 11 lezioni, data 28 novembre 2023.
Miscellanea / / November 29, 2023
Se conosci già qualcosa di Data Science e desideri continuare ad apprendere, colmare le lacune e fare più pratica, questo corso fa per te. Come parte del programma, approfondirai il campo della scienza dei dati: fare conoscenza con l'architettura MapReduce e l'ecosistema Apache Hadoop, comprendi la progettazione di Apache Spark e Apache Parquet e padroneggia le basi delle reti neurali e delle loro architetture. Imparerai anche come condurre analisi aziendali con Power BI e di quali competenze trasversali ha bisogno un project manager.
Lo scopo del corso è attirare la tua attenzione sui Big Data e sulla Data Science, pertanto tutti i materiali del corso sono a scopo informativo senza immergersi in tutte le complessità. Se sei interessato ad un approfondimento, utilizza i materiali del modulo aggiuntivo.
Il corso è composto da cinque moduli che ti aiuteranno a crescere sistematicamente nel campo della Data Science e ad addestrare tempestivamente la teoria acquisita nella pratica:
1. Immergiti nella scienza dei dati.
Ricorda quali processi comporta l'analisi dei dati. Scopri le nozioni di base su come funziona l'archiviazione a lungo termine. Lavorerai con SQL utilizzando Oracle DBMS come esempio e creerai il tuo primo database. Acquisisci familiarità con l'architettura MapReduce e l'ecosistema Apache Hadoop.
2. Strumenti per l'elaborazione, l'analisi e la visualizzazione dei dati.
Scopri cos'è Power BI e quali problemi possono essere risolti con il suo aiuto. Impara a ottenere, modellare, analizzare dati e creare visualizzazioni.
3. Strumenti per lavorare con i big data.
Capirai come funziona Apache Spark, uno strumento per lavorare con i big data. Scopri il formato di archiviazione dei dati Apache Parquet e le sue funzionalità. Inoltre, guarda gli esempi di utilizzo di Pyspark nel notebook Jupyter.
4. Sistemi di apprendimento automatico.
Imparerai cos'è il valore p, perché sono necessari i criteri statistici necessari e in quali compiti aiutano. Impara il concetto di reti neurali, le loro caratteristiche e le architetture di base. Capirai anche come sviluppare un approccio snello e pragmatico all'utilizzo dei big data.
5. Competenze trasversali e gestione dei progetti.
Imparare i principi e le tecniche di gestione dei progetti. Considera come funziona il ciclo di vita di un progetto gestito nel paradigma Agile. Imparerai anche quali sono le competenze trasversali chiave di cui un esperto ha bisogno per sviluppare capacità di leadership e di gestione dei progetti.
A chi è rivolto questo corso?
Il corso è rivolto a tutti coloro che hanno conoscenze di base di Data Science e desiderano approfondire il campo. Il corso è adatto anche a specialisti in ambito IT e settori affini interessati all'uso dell'apprendimento automatico business e laureati del corso “Big Data e Data Science: ricominciare il tuffo da zero” che desiderano proseguire la propria formazione.
Requisiti iniziali
Per rendere il corso chiaro e utile è necessario possedere competenze informatiche avanzate e conoscenze di base di programmazione e SQL. Puoi ottenerli nel corso precedente del nostro progetto - "Big Data e Data Science: inizia la tua immersione da zero".
3
corsoData Scientist, ricercatore ML/DL, insegnante
Esperienza nell'analisi - 5 anni. Ha lavorato come Data Scientist presso PJSC Megafon. Conduce corsi in Skillbox, Netology, Yandex. Workshop e altri progetti educativi. Relatore al convegno Big Data Days 2021.
Data Scientist freelance, docente e ricercatore ML/DL, autore del corso. Ha lavorato come ricercatore nel campo della "Teoria delle decisioni" nel servizio militare. Successivamente ha collaborato con aziende grandi e piccole. Ex scienziato dei dati PJSC Megafon.
1
BENEContribuiamo allo sviluppo degli scolari e degli studenti delle regioni russe e delle città in via di sviluppo Paesi limitrofi, trasferiamo loro l’esperienza e la competenza di università metropolitane, aziende e grandi realtà internazionali Hub IT
La Scuola Russa di Programmazione, abbreviata in RSP, opera nel campo dell'educazione di bambini e adulti negli ambiti dell'informatica e dello sviluppo competenze trasversali nei formati di campi di formazione, movimenti circolari, masterclass, webinar, workshop, corsi online e conferenze. Le nostre attività educative si basano sull'intensità e sulla profonda immersione nell'argomento, sul trasferimento di esperienze dagli anziani e dagli esperti ai principianti, sul mentoring e sul volontariato. Serviamo le idee di un’istruzione pratica accessibile e coltiviamo una nuova generazione di personale per l’economia digitale del Paese. La nostra missione è aiutare i giovani a diventare leader del cambiamento tecnologico.
Conoscenza
1. Saluti
Tuffo
1. Introduzione alla scienza dei dati
2. Tuffati nell'SQL
3. Grandi dati. Introduzione a MapReduce. Introduzione all'ecosistema Hadoop
Strumenti di elaborazione, analisi e visualizzazione dei dati
1. Analizzare i dati in Power BI
Strumenti per big data
1. Quadro Apache Spark
Sistemi di apprendimento automatico
1. Statistiche per principianti
2. Apprendimento automatico nel mondo degli affari
3. Nozioni di base sulla rete neurale
Competenze trasversali e gestione dei progetti
1. Gestione dei progetti dati
Completamento
1. Riepilogo e risultati del corso