Codice Sconto: E463456

This WebPage/Resource is provided by https://www.classicistranieri.com

Schätzfunktion – Wikipedia

Schätzfunktion

aus Wikipedia, der freien Enzyklopädie

Eine Schätzfunktion dient in der mathematischen Statistik dazu, aufgrund von vorhandenen empirischen Daten einer Stichprobe Informationen über bestimmte Parameter einer unbekannten Grundgesamtheit zu erhalten.

Inhaltsverzeichnis

[Bearbeiten] Konzept

In der Regel befindet sich der Experimentator in der Situation, dass er anhand endlich vieler Beobachtungen Aussagen über die zu Grunde liegende Wahrscheinlichkeitsverteilung und/oder bestimmte Parameter einer Zufallsvariablen treffen möchte. Die Menge aller vorhandenen Realisationen dieser Zufallsvariablen wird in diesem Fall Grundgesamtheit genannt.

[Bearbeiten] Grundgesamtheit bekannt

In seltenen Fällen lässt sich die Grundgesamtheit vollständig beobachten, so dass sie dann exakt die gewünschten Informationen liefert. Diese Situationen sind in der statistischen Praxis unüblich, wir haben es in der Regel mit einer unendlichen Grundgesamtheit zu tun. Die typischen Beispiele dienen auch nur der Motivation für bestimmte statistische Konzepte.

[Bearbeiten] Beispiel

In einer Urne sind fünf rote und vier blaue Kugeln. Es werden drei Kugeln ohne Zurücklegen aus dieser Urne gezogen. Definiert man die Zufallsvariable X: Zahl der roten Kugeln unter den drei gezogenen, ist X hypergeometrisch verteilt mit M=5 als Zahl der roten Kugeln in der Urne, N=9 als Gesamtzahl der Kugeln in der Urne und n=3 als Zahl der Versuche. Hier können alle Informationen über die Verteilung von X gewonnen werden, weil sowohl das stochastische Modell (Ziehen aus einer Urne) als auch die zugehörigen Parameter (Anzahl der roten und blauen Kugeln) bekannt sind.

[Bearbeiten] Grundgesamtheit unbekannt

In den meisten Fällen kann jedoch die Grundgesamtheit nicht vollständig beobachtet werden, weil sie zu groß ist. Interessiert man sich etwa für die mittlere Größe der 18-Jährigen in der EU, müsste man alle 18-Jährigen messen, was praktisch undurchführbar ist. In diesem Sinne könnte man das Urnenbeispiel von oben etwa so abwandeln:

[Bearbeiten] Beispiel

Ein Lebensmittelgroßmarkt bekommt eine Lieferung von 2000 Gläsern mit Pflaumenkompott. Problematisch sind in den Früchten verbliebene Kerne. Der Kunde toleriert einen Anteil von Gläsern mit Kernen von 5%. Er möchte sich bei dieser Lieferung vergewissern, dass diese Quote nicht überschritten wird. Eine komplette Erhebung der Grundgesamtheit von 2000 Gläsern ist allerdings nicht durchführbar, denn 2000 Gläser zu kontrollieren ist zu aufwendig und außerdem zerstört das Öffnen eines Glases die Ware. Allerdings könnte man eine kleine Zahl von Gläsern zufällig aussuchen, also eine Stichprobe nehmen, und die Zahl der zu beanstandenden Gläser zählen. Übersteigt diese Zahl eine bestimmte Grenze, den kritischen Wert der Prüfgröße, geht man davon aus, dass auch in der Lieferung zu viele zu beanstandende Gläser sind.

Ist die Grundgesamtheit einer Zufallsvariablen unbekannt, nimmt man also eine Stichprobe: Man wählt n Elemente zufällig aus der Grundgesamtheit aus. Mit Hilfe dieser Stichprobenelemente schätzt man den unbekannten Parameter der Grundgesamtheit. Diese Schätzung wird als Schätzfunktion bezeichnet. Da jede Stichprobe aufgrund der Zufälligkeit anders ausfällt, sind auch diese Schätzfunktionen Zufallsvariablen, deren Verteilung von der Verteilung des Merkmals in der Grundgesamtheit abhängt. Wichtig ist natürlich die Wahl eines geeigneten Schätzers.

An dieser Stelle setzt die mathematische Analyse an. Man möchte letztlich versuchen, ausschließlich anhand des Wissens um das zu Grunde liegende Modell und der beobachteten Zufallsvariablen zum Beispiel Wahrscheinlichkeiten für Intervalle angeben, in denen sich mit größter Wahrscheinlichkeit der wahre Parameter befindet. Alternativ möchte man auch bei einer bestimmten Fehlerwahrscheinlichkeit testen, ob eine bestimmte Vermutung über den Parameter (zum Beispiel, dass zu viele Gläser Kerne enthalten) bestätigt werden kann. Schätzfunktionen bilden in diesem Sinne die Basis für jede begründete Entscheidung über die Ausprägungen der Grundgesamtheit, die bestmögliche Wahl solcher Funktionen sind das Ergebnis der mathematischen Untersuchung.

Man hofft bei diesem Vorgehen natürlich, dass die Stichprobe die Grundgesamtheit widerspiegelt, kann sich dessen aber nicht sicher sein. Geht die Lieferung aufgrund dieser Entscheidung zurück, besteht die Möglichkeit, dass die Entscheidung richtig war, dass also zu viele Gläser mit Kernen in der Lieferung sind. Andererseits kann auch die Stichprobe untypisch ausgefallen sein, so dass man die Lieferung fälschlicherweise ablehnt. Dennoch besteht in der Praxis zumeist keine Alternative zu statistischen Verfahren dieser Art.

[Bearbeiten] Formale Definition der Schätzfunktion

Grundlage einer jeden Schätzfunktion ist die Beobachtung eines statistischen Merkmals x. Modelltheoretisch wird dieses Merkmal idealisiert: Man geht davon aus, dass es sich in Wahrheit um eine Zufallsvariable X handelt, deren „wahre“ Verteilung und „wahre“ Verteilungsparameter unbekannt sind.

Um Informationen über die tatsächlichen Eigenschaften des Merkmals zu erhalten, bildet man eine Stichprobe von n Elementen. Mit Hilfe dieser Stichprobenelemente schätzt man dann die Parameter.

Um einen Parameter γ einer unbekannten Verteilung zu schätzen, hat man es formal also mit einer Zufallsstichprobe vom Umfang n zu tun, es werden also n Realisationen xi (i = 1, ... , n) der Zufallsvariablen X beobachtet. Man fasst die n Realisationen wahrscheinlichkeitstheoretisch als unabhängige Folge von n Zufallsvariablen Xi auf. Um den Parameter γ zu schätzen, werden die Xi in geeigneter Weise zusammengefasst. Sie bilden eine Schätzfunktion g(X1, X2, ..., Xn) oder Stichprobenfunktion. Formal wird dabei vorausgesetzt, dass g eine messbare Funktion ist. Da die Stichprobe zufällig erfolgt, ist die Schätzfunktion wiederum eine Zufallsvariable.

[Bearbeiten] Ausgewählte Schätzfunktionen

[Bearbeiten] Metrisches Merkmal

[Bearbeiten] Typische Schätzer für den Erwartungswert

Der Erwartungswert wird in der Regel mit dem arithmetischen Mittel der Stichprobe geschätzt:

 \widehat{EX}_1= \bar X=
 \frac{1}{n}\sum_{i=1}^n X_i
.

Ist die Verteilung symmetrisch, kann auch der Median der Stichprobe als Schätzer für den Erwartungswert verwendet werden:

 \widehat{EX}_2= Z=X_{\left \lfloor \frac{n+1}{2} \right \rfloor}
,

wobei \left\lfloor \; \right\rfloor die untere Gaußklammer bezeichnet. Der Median ist also der Wert derjenigen Zufallsvariable, die nach Sortierung der Daten "in der Mitte" liegt. Es befinden sich also zahlenmäßig genauso viele Werte oberhalb wie unterhalb des Median.

Welcher Schätzer im Falle symmetrischer Verteilungen besser ist, hängt von der betrachteten Verteilungsfamilie ab.

[Bearbeiten] Typische Schätzer für die Varianz

Für die Varianz der Grundgesamtheit verwendet man zumeist die Stichprobenvarianz als Schätzfunktion:

 \widehat{varX}= \hat{S}_n^2=
 \frac{1}{n-1}\sum_{i=1}^n (X_i- \bar X)^2
.

Typische andere Normierungen sind auch \frac{1}{n} und \frac{1}{n+1}. All diese Schätzer sind zwar asymptotisch äquivalent, werden aber je nach Verteilung abwechselnd benutzt.

[Bearbeiten] Verhalten der Schätzer bei Normalverteilungen

Die Verteilung der Schätzfunktionen hängt natürlich von der Verteilung des Merkmals in der Grundgesamtheit ab.

Falls die Daten normalverteilt mit Erwartungswert μ und Varianz σ 2 sind, besitzt der Schätzer \bar X als lineare Transformation der Xi die Verteilung

 \bar X\sim N(\mu; \frac{\sigma^2}{n})
 .

Der Varianzschätzer \hat{S}_n^2 enthält eine Quadratsumme von bezüglich  \bar X zentrierten normalverteilten Zufallsvariablen. Deshalb ist der Ausdruck

  \frac{(n-1)\hat{S}_n^2}{\sigma^2}

zentral χ2-verteilt mit n-1 Freiheitsgraden.

Ist die Verteilung des Merkmals unbekannt, kann bei genügend großem Stichprobenumfang die Verteilung der Schätzfunktion in vielen Fällen näherungsweise mit der Normalverteilung angegeben werden.

[Bearbeiten] Dichotome Grundgesamtheit

Man betrachtet hier das Urnenmodell mit zwei Sorten Kugeln. Es soll der Anteilswert der Kugeln erster Sorte in der Grundgesamtheit geschätzt werden. Als Schätzfunktion verwendet man den Anteil der Kugeln erster Sorte in der Stichprobe,

P=\frac{X}{n}

mit X: Zahl der Kugeln erster Sorte in der Stichprobe. Die Verteilung von P ist die gleiche wie die der entsprechenden Zufallsvariablen X, also eine Binomialverteilung im Modell mit Zurücklegen und eine hypergeometrische Verteilung im Modell ohne Zurücklegen.

[Bearbeiten] Wünschenswerte Eigenschaften von Schätzfunktionen

[Bearbeiten] Konsistenz

Die Schätzfunktion soll konsistent sein.

Konsistenz, mit einfachen Worten, besagt, dass sich die Schätzfunktion mit wachsendem n immer mehr dem wahren Parameter γ nähert.

Die formale Definition lautet:

Eine Schätzfunktion ist konsistent, wenn für jedes ε>0 gilt:

 \lim_{n \to \infty}P(|g_n -\gamma|>\epsilon)=0.

mit gn. = g(X1, X2, ..., Xn).

Man spricht hier von stochastischer Konvergenz.

[Bearbeiten] Erwartungstreue

Die Schätzfunktion soll im Mittel gleich dem wahren Parameter γ sein:

Eg = γ

Weicht Eg systematisch von γ ab, ist der Schätzer verzerrt (“biased“). Die Verzerrung b ist

b = Eg − γ.

[Bearbeiten] Minimale Varianz, Effizienz

Die Schätzfunktion soll eine möglichst kleine Varianz haben. Die Schätzfunktion g* aus allen erwartungstreuen Schätzfunktionen gk, die die kleinste Varianz hat, wird dabei als effiziente, beste oder wirksamste Schätzfunktion bezeichnet.

[Bearbeiten] Mittlerer quadratischer Fehler

Eine Schätzfunktion, die nicht notwendigerweise erwartungstreu ist, soll einen kleinen mittleren quadratischen Fehler aufweisen. Der mittlere quadratische Fehler ist die erwartete quadratische Abweichung vom Parameter:

E[(g − γ)2] = (E[g − γ])2 + E[(gEg)2] = b2 + V2

Der mittlere quadratische Fehler ist die Summe des quadrierten Bias und der Varianz. Die Genauigkeit eines Schätzers bzw. einer Schätzfunktion wird oft mit dem mittleren quadratischen Fehler gemessen.

[Bearbeiten] Weitere Stichworte


[Bearbeiten] Konfidenzintervall

Siehe auch

[Bearbeiten] Hypothesentest

Siehe

[Bearbeiten] Weblinks

Codice Sconto: E463456

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -