Regressione lineare - corso 4900 rubli. da Open education, formazione 5 settimane, circa 2 ore settimanali, data 29 novembre 2023.
Miscellanea / / November 29, 2023
Se l’analisi di correlazione consente di quantificare la forza e la direzione della relazione tra due quantità, allora la costruzione di modelli di regressione offre maggiori opportunità. Utilizzando l'analisi di regressione, è possibile descrivere quantitativamente il comportamento delle quantità studiate in base alle variabili predittive e ottenere previsioni su nuovi dati. Imparerai come costruire modelli lineari semplici e multipli utilizzando il linguaggio R. Ogni metodo ha i suoi limiti, quindi ti aiuteremo a capire in quali situazioni la regressione lineare può e non può essere utilizzata e ti insegneremo i metodi per diagnosticare selezionati Modelli. Un posto speciale nel corso è dato all'anatomia approfondita dell'analisi di regressione: padroneggerai le operazioni con matrici che sono la base della regressione lineare per poter comprendere varietà più complesse di lineare Modelli.
Se ti trovi di fronte alla necessità di ricercare e descrivere le relazioni tra alcuni fenomeni che possono essere misurati quantitativamente, allora questo corso è una buona opportunità per capire come funziona la regressione lineare semplice e multipla, conoscere le possibilità e i limiti di queste metodi.
Il corso è rivolto a coloro che hanno già familiarità con le tecniche base di analisi dei dati utilizzando il linguaggio R e con la creazione di semplici documenti .html utilizzando rmarkdown e knitr.
Interessi scientifici: struttura e dinamica delle comunità bentoniche marine, scale spaziali, successione, interspecifiche e intraspecifiche interazioni biotiche, crescita e riproduzione degli invertebrati marini, struttura demografica delle popolazioni, microevoluzione, biostatistica.
Il corso è composto da 5 moduli:
1. Analisi di correlazione. Regressione lineare semplice
Inizieremo la nostra conversazione sui metodi per descrivere numericamente le relazioni tra quantità quantitative con covarianza e coefficienti di correlazione, che ci consentono di stimare la forza e la direzione della relazione. Quindi imparerai quali informazioni aggiuntive sulle relazioni possono essere ottenute costruendo un modello lineare della relazione tra le quantità. Imparerai a interpretare i coefficienti di regressione e apprenderai quando e come utilizzare i modelli lineari per fare previsioni su nuovi dati. Alla fine di questo modulo imparerai come adattare un'equazione del modello lineare e tracciarla con una regione di confidenza.
2. Testare il significato e la validità dei modelli lineari
Costruire un modello lineare e scriverne l'equazione è solo l'inizio dell'analisi. In questo modulo imparerai come descrivere i risultati dell'analisi di regressione: come testare la significatività statistica del modello complessivo o dei suoi coefficienti e valutare la qualità dell'adattamento. I modelli lineari (o meglio, i test statistici che vengono utilizzati per essi), come ogni metodo, hanno i loro limiti. Imparerai quali sono queste limitazioni e da dove provengono. I metodi diagnostici grafici che utilizzeremo sono universali per diversi modelli lineari: più pratica ti aiuterà a prendere decisioni con maggiore sicurezza. Una volta compreso tutto ciò, puoi scrivere uno script completo in R per adattare, diagnosticare e presentare i risultati di una semplice regressione lineare.
3. Una breve introduzione al mondo dell'algebra lineare
In questo modulo ci immergeremo nel cuore dei modelli lineari. Per fare ciò, dovrai imparare o ricordare le basi dell'algebra lineare. Discuteremo i diversi tipi di matrici, come crearle in R e le operazioni di base con esse. Tutto questo ci servirà per capire come funziona la regressione lineare dall’interno. Imparerai cos'è una matrice modello, imparerai come scrivere un'equazione di regressione lineare sotto forma di matrici e trovare i suoi coefficienti. Vedrai con i tuoi occhi la matrice del cappello, che ti permette di ottenere i valori previsti, e potrai anche calcolarla manualmente. Infine, imparerai a calcolare la varianza residua, la matrice varianza-covarianza e a utilizzare tutto ciò per costruire una zona di confidenza di regressione. Quindi questa conoscenza ti aiuterà a comprendere la struttura di modelli più complessi: con predittori discreti, con diverse distribuzioni di residui, con una diversa struttura della matrice di variazione-covarianza.
4. Regressione lineare multipla
Molto spesso, le relazioni tra le quantità sono più complesse di quanto possa essere descritto utilizzando una semplice regressione lineare. La regressione lineare multipla viene utilizzata per descrivere come una variabile di risposta dipende da più predittori. Con la comparsa di predittori multipli nel modello, la regressione lineare ha una nuova condizione di applicabilità: il requisito dell'assenza di multicollinearità. In questo modulo imparerai come identificare ed evitare la multicollinearità. Infine, spesso ci sono più variabili in più modelli di quelle che possono essere rappresentate su un piano, Per questo ti insegneremo semplici tecniche che ti aiuteranno a creare grafici informativi anche in questo caso.
5. Confronto di modelli lineari
I modelli lineari multipli sono come un set di costruzione: i modelli più complessi possono essere smontati e semplificati. Imparerai come vengono utilizzati i confronti dei modelli nidificati utilizzando il test F parziale per testare la significatività di singoli predittori o gruppi di predittori. Modelli più complessi descrivono meglio i dati originali, ma una complicazione eccessiva è pericolosa perché tali modelli iniziano a fare previsioni inadeguate sui nuovi dati. Utilizzando i test F parziali, è possibile semplificare i modelli eliminando gradualmente i predittori non significativi. I modelli semplificati sono più facili da usare per interpretare e presentare i risultati. Tutto ciò che hai imparato finora sulla regressione lineare può essere applicato completando un progetto di analisi dei dati dove necessario costruire correttamente un modello lineare multiplo ottimale e presentarne i risultati in un rapporto scritto utilizzando rmarkdown e knitr.