Nozioni di base su Panda per principianti - corso RUB 990. da Stepik, formazione 46 lezioni, data 5 novembre 2023.
Miscellanea / / December 04, 2023
Lo scopo del corso non è solo raccontare, ma insegnarti come lavorare con le librerie Numpy e Pandas.
Dietro le quinte non c'è un noioso docente, ma un data scientist che lavora ogni giorno con queste biblioteche. Nel formato della comunicazione dal vivo (l'autore sembra comunicare con te attraverso una telecamera), impareremo come lavorare in Panda.
Informazioni sul corso
1. Informazione
Nozioni di base su Numpy
1. Perché hai bisogno di Numpy quando impari i Panda?
2. Pratica: forma, dtype, ndim, zeri, uno, arange
3. Tipi di dati e loro conversione, aritmetica, accesso agli elementi
4. Esercitazione: aritmetica, conversione di tipi, accesso agli elementi
5. Array bidimensionali e tridimensionali. Imparare a usare gli indici
6. Pratica: rafforzare il lavoro con gli indici
7. Maschera e affetta insieme, indicizza in modo fantasioso e rimodella
8. Esercizio: imparare a cambiare la forma di un array
9. Maggiori informazioni su rimodellamento, trasposizione, funzioni unarie e binarie
10. Esercitazioni: consolidare le conoscenze sulle funzioni unarie e binarie
11. Funzioni logiche e funzione all'interno di una funzione, nonché posizione e statistiche
12. Esercizio: padroneggiare le funzioni utili
13. Funzioni qualsiasi, tutto, ordinamento, unico, in1d. Panoramica sull'algebra lineare
14. Funzioni di permutazione e shuffle. Salvataggio di un array in un file
Introduzione ai Panda
1. Prima conoscenza con la serie
2. Esercizio: testare le tue conoscenze sulla serie
3. Scopri di più sulle serie: indici, addizioni, controllo di NaN
4. Pratica: sottigliezze quando si lavora con le serie
5. Prima conoscenza con DataFrame
6. Ulteriori informazioni su DataFrame: indici, dizionari nidificati, del e .T
7. Esercizio: indicizzazione delle caratteristiche
8. Le funzioni reindicizzano, rilasciano e indicizzano in un dataframe
9. Pratica: tirare fuori ciò che ti serve, togliere ciò che non ti serve
10. Operatori loc, iloc, at, iat. Aggiunta di più frame di dati
11. Aggiunta di dataframe, ordinamento, aritmetica con lacune
12. Statistiche descrittive. Valori unici
13. Test
14. Prova (continua)
Panda: lavorare con origini dati
1. Cos'è il formato CSV e come domarlo?
2. Ulteriori informazioni sull'elaborazione dei passaggi
3. Imparare a leggere file di grandi dimensioni in pezzi
4. Chi è JSON e come fare amicizia con esso?
5. Conoscere i formati HTML, XML, PICKLE, HDF5
6. Il buon vecchio Excel e qualcosa sui database
Panda: pulizia e preparazione dei dati per l'analisi
1. Imparare a gestire i passaggi
2. Controlliamo i dati per verificare la presenza di duplicati e li eliminiamo
3. Informazioni sulla sostituzione dei valori e sulla discretizzazione
4. Identifichiamo le emissioni e le eliminiamo adeguatamente
5. Creazione di matrici di variabili dummy
6. Lavorare con le stringhe è più facile di quanto sembri!
Panda: unione dei dati e trasformazione delle forme
1. Introduzione all'indicizzazione gerarchica
2. Azioni con multi-indici nei dataframe
3. Imparare a connettere frame di dati utilizzando l'unione
4. Analogo per unire; concatenazione di frame di dati utilizzando concat
5. Combinazione di dati e trasformazione di moduli