See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Bestimmtheitsmaß – Wikipedia

Bestimmtheitsmaß

aus Wikipedia, der freien Enzyklopädie

Das Bestimmtheitsmaß (abk. R2, auch Determinationskoeffizient) ist ein Maß der Statistik für den Anteil der erklärten Varianz eines Zusammenhangs.

Beträgt es für zwei Variablen X und Y beispielsweise R2 = 0,5, dann heißt dies, dass die Hälfte (50%) der Streuung von Y durch lineare Abhängigkeit von X erklärt werden kann.

Inhaltsverzeichnis

[Bearbeiten] Das (unbereinigte) Bestimmtheitsmaß R2

Das Bestimmtheitsmaß wird oft mit R2 abgekürzt. R2 liegt zwischen

0 (kein linearer Zusammenhang: das Regressionsmodell besteht nur aus einer Konstanten) und
1 (exakter linearer Zusammenhang: alle Fehlerterme sind Null).

Es gibt an, in welchem Maße die Varianz einer Variablen durch die Varianz einer anderen Variablen bestimmt wird.

Einfachregression: Es entspricht bei einfachen Regressionen dem Quadrat des Pearson'schen Korrelationskoeffizienten R und lässt sich aus der Kovarianz und den Einzelvarianzen berechnen:

R^2 = \frac{\operatorname{Cov}(X,Y)^2}{\operatorname{Var}(X)\operatorname{Var}(Y)}.

Multiple Regression: Bei multiplen Regressionen entspricht das R2 dem Quadrat aus dem multiplen Korrelationskoeffizienten und wird wie folgt berechnet:

R^{2} = \frac{SS_{Reg}}{SS_{Total}} = 1 - \frac{SS_{Res}}{SS_{Total}} = 1 - \frac{RSS}{SS_{Total}}
wobei SS_{Reg} = \sum\limits_{i=1}^{n} (\hat{Y}_i - \overline{Y})^2 \ , \quad \overline{Y}=\frac{1}{n}\sum\limits_{i=1}^{n} Y_i die Summe der quadrierten Regressionswerte darstellt. Diese wird als die durch die Regression erklärte Variabilität interpretiert.
SS_{Res}=RSS=\sum\limits_{i=1}^{n} (Y_i - \hat{Y}_i)^2 ist die Summe der quadrierten Residuen (residual sum of squares), diese wird als die nicht erklärte Variabilität gedeutet.
SS_{Total}=\sum\limits_{i=1}^{n} (Y_i - \overline{Y})^2 stellt die Summe der quadrierten Beobachtungen (total sum of squares) dar. Diese wird als die totale Variabilität interpretiert.

Aus der ersten Gleichung zu R2 erkennt man, dass R2 das Verhältnis von erklärter Variabilität und totaler Variabilität darstellt. Falls somit R2 sehr nahe bei 1 liegt, dann liegt die erklärte Variabilität sehr nahe bei der totalen Variabilität. Ferner gilt die Streuungszerlegung:

SSTotal = SSReg + SSRes.

[Bearbeiten] Kritik

  • Das Bestimmtheitsmaß zeigt zwar die Qualität der linearen Approximation, jedoch nicht, ob das Modell richtig spezifiziert wurde. Modelle, die mittels kleinster Quadrate geschätzt wurden, werden daher die höchsten R2 erhalten.
  • Außerdem sagt es nichts über die statistische Signifikanz des ermittelten Zusammenhangs und der einzelnen Regressoren aus. Dazu muss zusätzlich ein Signifikanztest durchgeführt werden.
  • Ein weiterer Nachteil liegt in der Empfindlichkeit gegenüber Trends: Sofern sich eine exogene Variable parallel zu einer erklärenden entwickelt, werden unabhängig von der wahren Erklärungskraft des Modells hohe R2 ausgewiesen.

[Bearbeiten] Das korrigierte Bestimmtheitsmaß \bar R^2

Das (einfache) Bestimmtheitsmaß kann mit steigender Anzahl der Regressoren nie sinken, selbst wenn dieser Regressor ungeeignet ist. Daher ist es ratsam, das korrigierte Bestimmtheitsmaß (auch bereinigtes, adjustiertes oder angepasstes Bestimmtheitsmaß genannt) zu Rate zu ziehen. Dieses "bestraft" jeden neu hinzugezogenen Regressionskoeffizienten und berechnet sich wie folgt:

\bar R^2 = 1- (1-R^2) \frac{n-1}{n-p-1}.

Hierbei gibt

  • n die Anzahl der Daten und
  • p die Anzahl Regressoren (ohne den konstanten Term) an.

Das angepasste Bestimmtheitsmaß \bar R^2 steigt nur, wenn R2 ausreichend steigt, um den gegenläufigen Effekt des Quotienten \frac{n-1}{n-p-1} auszugleichen und kann auch sinken. Auf diese Weise lässt sich \bar R^2 als Entscheidungskriterium bei der Auswahl zwischen zwei alternativen Modellspezifikationen (etwa einem restringierten und einem unrestringierten Modell) verwenden.

[Bearbeiten] Vergleich: Unbereinigtes und bereinigtes Bestimmtheitsmaß

Das unbereinigte Bestimmtheitsmaß R2 hat zudem die nicht erwünschten Eigenschaften, dass es

  • mit steigender Varianz von Y steigt, ohne dass der Grad der Anpassung sich verbessert hat und
  • mit dem Umfang der Stichprobe steigt.

Auch diese negativen Eigenschaften werden durch das korrigierte Bestimmtheitsmaß über den Korrekturfaktor \frac{n-1}{n-p-1} ausgeglichen. Es wird von daher auch möglich, Schätzungen mit unterschiedlichem Stichprobenumfang oder unterschiedlicher Varianz der abhängigen Variablen miteinander zu vergleichen.

Das korrigierte Bestimmtheitsmaß \bar R^2 kann auch negative Werte annehmen und ist kleiner als das unbereinigte, außer falls R^2= 1\;, dann ist auch \bar R^2=1.

[Bearbeiten] Pseudo-Bestimmtheitsmaß

Bei bestimmten statistischen Modellen, z.B. bei Maximum-Likelihood-Schätzungen, existiert das Bestimmtheitsmaß R2 nicht. In solchen Modellen wird das sogenannte Pseudo-Bestimmtheitsmaß verwendet. Unter diesem Begriff wurden verschiedene Maße vorgeschlagen, darunter das unter Ökonomen am häufigsten verwendete von McFadden (mit lnL0 aus dem Modell mit lediglich einer Konstanten):

R^2_{MF}=1-{\ln L_{unrestr} \over \ln L_0}.

[Bearbeiten] Siehe auch


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -