Multiple lineare Regression in R [ALL IN ONE] - Voraussetzungen, Durchführung und Interpretation

Описание к видео Multiple lineare Regression in R [ALL IN ONE] - Voraussetzungen, Durchführung und Interpretation

Diese Video zeigt das Prüfen der Voraussetzungen, Rechnen und Interpretieren der Ergebnisse einer multiplen linearen Regression in R.

Die multiple lineare Regression ist ein statistisches Modell, das verwendet wird, um die Beziehung zwischen einer abhängigen Variablen y und mehreren unabhängigen Variablen x1, x2, x3, etc. zu schätzen.

‼ ACHTUNG: Augrund eines Updates im Paket lmtest sollte bei der Schätzung der heteroskedastizitätskonsistenten Standardfehler mit coeftest() zusätzlich das sandwich-Paket mit library(sandwich) geladen sein. Der Code funktioniert dann weiterhin wie im Video gezeigt.


Das Ziel der multiple linearen Regression ist es, eine Lineare Gleichung zu finden, die am besten die abhängige Variable y beschreibt, basierend auf den Werten der unabhängigen Variablen. Die Gleichung sieht in etwa so aus:

y = b0 + b1 * x1 + b2 * x2 + b3 * x3 + ... + e

wobei b0 der Y-Achsenabschnitt ist, b1, b2, b3, etc. die Regressionskoeffizienten sind und e der Fehlerterm ist. Die Regressionskoeffizienten geben an, wie sehr jede unabhängige Variable den Wert von y beeinflusst. Wenn zum Beispiel der Regressionskoeffizient für x1 positiv ist, bedeutet dies, dass, wenn der Wert von x1 zunimmt, der Wert von y auch zunimmt. Wenn der Regressionskoeffizient für x1 negativ ist, bedeutet dies, dass, wenn der Wert von x1 zunimmt, der Wert von y abnimmt.


Dieses Video ist in 4 Teile untergliedert.

1) Die Voraussetzungen einer multiplen linearen Regression sind:
metrische abhängige Variable
hinreichende Linearität zwischen unabhängigen Variablen und abhängiger Variable
Normalverteilte Residuen
Homoskedastizität (Gleichmäßige Streuung der Residuen)
Keine Multikollinearität (zu hohe Korrelation zwischen unabhängigen Variablen)
Keine einflussreichen Fälle (umgangssprachlich "Ausreißer")

2) Die Durchführung inklusive der Berechnung robuster Standardfehler wird vorgenommen.

3) Die Interpretation der Ergebnisse, speziell dem F-Test, der Modellgüte (R²) und der Koeffizienten wird gezeigt.

4a) Eine Beispieltabelle für die Ergebnisse wird gezeigt.

4b) Eine Prognose mittels der durch das Modell geschätzten Regressionsgleichung wird gezeigt.


Wichtige andere Videos
===================
🎥 Fehler 1. Art und 2. Art:    • Fehler 1. Art und Fehler 2. Art (Alph...  
🎥 Normalverteilung Residuen bei der linearen Regression:    • Wie teste ich Residuen auf Normalvert...  
🎥 Q-Q-Diagramm:    • Q-Q-Diagramm in R - Test auf Normalve...  
🎥 Shapiro-Wilk-Test unbrauchbar?:    • Wie brauchbar sind Kolmogorov-Smirnov...  
🎥 Test auf Homoskedastizität:    • Heteroskedastizität in R erkennen (gr...  
🎥 Robuste Standardfehler berechnen:    • Was tun bei Heteroskedastizität in de...  
🎥 Multikollinearität prüfen:    • Multikollinearität erkennen in R - Da...  
🎥 Cook-Distanz für ungewöhnliche Fälle:    • Cook-Distanz in R berechnen und inter...  
🎥 Standardisierte Koeffizienten ermitteln:    • Standardisierte Koeffizienten für die...  
🎥 Regression mit Dummyvariablen:    • Regression mit Dummy-Variablen in R -...  


Datensatz und Blogbeitrag noch mal zum Nachlesen:
===========================================
💡 Multiple lineare Regression in R: https://www.bjoernwalther.com/multipl...


Mehr Tutorials und Begleitmaterial:
============================
🌐Meine Homepage: https://bjoernwalther.com/


📚 Literatur:
==========
Robuste Standardfehler schätzen:
📚 Hayes, A. F., & Cai, L. (2007). Using heteroskedasticity-consistent standard error estimators in OLS regression: An introduction and software implementation. Behavior research methods, 39(4), 709-722.

Multikollinearität - VIF unter 10:
📚 Field, Andy. Discovering statistics using IBM SPSS statistics. Sage, 2018, S. 402.

Einflussreiche Fälle:
📚 Cook, R., & Weisberg, S. (1982). Criticism and Influence Analysis in Regression. Sociological Methodology, 13, 313-361.
📚 Hardin, J. W., Hilbe, J. M. (2007). Generalized linear models and extensions, S. 49.


📘 Für die Leser unter euch:
=======================
Mein Buch "Statistik mit R - Schnelleinstieg": https://amzn.to/3OzeLJI [Affiliatelink]


⭐Kanalmitglied⭐ werden:
=======================
   / @statistikampc_bjoernwalther  


Kanal unterstützen? 🙌🏼
===================
Paypal-Spende: https://www.paypal.com/paypalme/Bjoer...
Amazon Affiliate-Link: http://amzn.to/2iBFeG9

Danke für eure Unterstützung! ♥


Zeitstempel ⏰
============
0:00 Einleitung und Ausblick
0:15 Regressionsmodell definieren
1:06 Voraussetzung - metrische abhängige Variable
1:33 Voraussetzung - Linearität zwischen AV und UV
2:41 Voraussetzung - Normalverteilung der Residuen
4:11 Voraussetzung - Homoskedastizität der Residuen
6:45 Voraussetzung - keine Autokorrelation
7:12 Voraussetzung - keine Multikollinearität
8:58 Voraussetzung - keine einflussreichen Fälle ("Ausreißer")
11:29 Robuste Standardfehler als pauschales Vorgehen
13:12 Interpretation - F-Statistik
14:08 Interpretation - Modellgüte
15:17 Interpretation - Koeffizienten
18:13 Standardisierte Koeffizienten zum Vergleich der Einflussstärke
19:40 Reporting - notwendige Bestandteile
20:25 Prognose mit der Regressionsgleichung

Комментарии

Информация по комментариям в разработке