Specializzazione "Analista dati" - corso 2900 rubli. da Stepik, formazione 36 lezioni, Data: 29 ottobre 2023.
Miscellanea / / December 05, 2023
Analista di dati, analista di prodotto, analista della base clienti, analista CRM, scienziato dei dati: tutte queste professioni sono legate all'analisi dei dati.
🎯 Requisiti TOP per queste professioni:
- Conoscenza di SQL ed esperienza di lavoro con database;
- Conoscenza della sintassi base di Python e conoscenza della libreria Pandas;
- Conoscenza della statistica e capacità di applicarla nell'analisi dei dati;
- Pensiero analitico.
Questa non è una lista completa. Ad esempio, gli analisti web devono conoscere Google Analytics e Yandex. Metriche e, per i data scientist, apprendimento automatico. Ma ho fornito i requisiti di base che si trovano nel 70-80% dei posti vacanti.
La specializzazione Data Analyst è attualmente composta da due corsi:
1️⃣ SQL per tutti
Durante il corso, padroneggerai SQL al livello di scrivere query SQL complesse e ti eserciterai nell'utilizzo dei dati di una società commerciale in uno dei sistemi di gestione di database più popolari.
Il corso è pensato per i principianti che vogliono padroneggiare SQL, così come per coloro che conoscono SQL a livello base, ma vogliono colmare le lacune e consolidare le proprie conoscenze nella pratica.
2️⃣ Python: analisi dei dati con Panda
Il corso è dedicato al lavoro pratico con i Panda. Riceverai la teoria necessaria e la rafforzerai con un gran numero di problemi pratici.
Il corso è adatto a chi ha già familiarità con la sintassi base di Python:
- Conosce i tipi di dati di base (inclusi elenchi e dizionari) e le operazioni su di essi;
- Ha una comprensione di cosa siano una funzione e un metodo.
Il corso può essere seguito anche da principianti che possono capire autonomamente come installare Python e la libreria Pandas. Ma se hai appena iniziato con Python, dovrai recuperare alcune cose di base da solo man mano che il corso procede. A proposito, in questo corso puoi acquisire una conoscenza di base della sintassi Python. Quindi imparare i panda sarà molto più semplice.
Il concetto dei corsi si basa su tre principi:
Semplicità
La presentazione del materiale è accessibile e coerente: ciò ti consentirà di formare passo dopo passo la base di conoscenza necessaria.
Pratica
Viene prestata molta attenzione alla pratica, in modo da non solo risolvere i problemi del corso, ma anche essere in grado di applicare le conoscenze in futuro, su progetti reali.
Supporto
Sentiti libero di porre domande nei commenti, per me è importante che tutto il materiale venga appreso. Rispondo ai commenti entro un giorno.
L'ordine in cui vengono seguiti i corsi non è importante.
1. SQL per tutti
Operazioni su una tabella
1. Introduzione alla banca dati
2. Filtraggio delle righe WHERE. Espressioni regolari COME. AND e OR
3. Ordinamento delle stringhe ORDER BY
4. Funzioni di aggregazione: COUNT, SUM, MIN, MAX, AVG. Alias
5. Raggruppamento di linee GROUP BY e HAVING. Generazione di report
6. Esercitazioni basate sui risultati del 1° modulo
Operazioni su più tabelle
1. Concetti di chiave primaria e chiave esterna. Tipi di relazioni nel database
2. Generazione di query da più tabelle. INNER JOIN e alias
3. LEFT JOIN e altri tipi di JOIN
4. Unione di più tabelle utilizzando UNION e UNION ALL
5. Sottoquery
6. Esercitazioni basate sui risultati del 2° modulo
Ulteriori argomenti importanti
1. Espressione CASO
2. Funzioni popolari per lavorare con le stringhe
Compiti pratici per rafforzare il materiale del corso
1. Domande semplici
2. Domande complesse
3. Conclusione
2. Python: analisi dei dati con Panda
Analizzare i dataframe individualmente
1. Lettura di dati da file
2. Introduzione rapida ai dati
3. Uscita della colonna
4. Tipi di dati
5. Filtraggio delle righe
6. Espressioni regolari
7. Ordinamento di stringhe
8. Funzioni di aggregazione
9. Raggruppamento di righe
Analisi di più dataframe correlati
1. Unisci a. K. un'unione
2. Concatenazione
Modulo aggiuntivo richiesto
1. Lavorare con date e orari
2. Tabelle pivot
3. Nuovi modi per creare dataframe
4. Categorizzazione delle caratteristiche nominali
5. Sostituzione di valori in un dataframe
6. Visualizzazione nei panda
7. Affettare
8. Conclusione