Normale verdeling
Uit Wikipedia, de vrije encyclopedie
Kansdichtheid De groene curve toont de standaardnormale verdeling |
|
Kansverdelingsfunctie Kleuren komen overeen met de kansdichtheidsfunctie hierboven |
|
Parameters | μ locatie (reëel) σ2 > 0 gekwadrateerde schaal (reëel) |
Drager | |
Kansdichtheid | |
Kansverdeling | |
Verwachtingswaarde | μ |
Mediaan | μ |
Modus | μ |
Variantie | σ2 |
Scheefheid | 0 |
Kurtosis | 0 |
Entropie | |
Moment- genererende functie |
|
Karakteristieke functie |
De normale verdeling of Gauss-verdeling (genoemd naar de Duitse wiskundige Carl Friedrich Gauss) is een begrip uit de kansrekening. Deze verdeling vindt onder meer toepassing in de statistiek. Het is een continue kansverdeling met een asymptotisch gedrag. De bijbehorende kansdichtheid is hoog in het midden, en wordt naar lage en hoge waarden steeds kleiner zonder ooit echt nul te worden. Door de vorm wordt deze kansdichtheid ook wel klokkromme of Gausscurve genoemd. Ze wordt gegeven door de formule:
- ,
waarin twee parameters, μ en σ, voorkomen. De normale verdeling wordt wel genoteerd als N(μ,σ2)-verdeling, wat wil zeggen dat het een normale verdeling is met verwachtingswaarde μ en standaardafwijking σ.
De integraal van deze functie, voor x lopend van tot , is precies 1.
De normale verdeling is symmetrisch om het centrum: de verwachtingswaarde μ van de verdeling is het 'middelpunt' van de grafiek van de verdelingsfunctie. De 'breedte' van de grafiek van de kansdichtheid wordt gekarakteriseerd door de standaarddeviatie σ (of de variantie σ2).
Inhoud |
[bewerk] Standaardnormale verdeling
Een normale verdeling met verwachtingswaarde 0 en variantie 1, de N(0,1)-verdeling, wordt een standaardnormale verdeling genoemd. De bijbehorende dichtheid is:
Zie ook: z-scores.
[bewerk] Kenmerkende kwantielen
Binnen één standaarddeviatie van de verwachtingswaarde ligt 68% van het oppervlak onder de grafiek van de kansdichtheid van de normale verdeling, 95% binnen twee standaarddeviaties. De curve gaat daarna vrij snel naar nul: 99,99% van het oppervlak ligt binnen vier standaarddeviaties van het midden. Afwijkingen van meer dan vier standaarddeviaties van het midden zijn dus zeer zeldzaam.
[bewerk] Voorkomen
Voor heel veel natuurlijk voorkomende verschijnselen is een normale verdeling een goede beschrijving van de frequentie waarmee bepaalde meetwaarden kunnen voorkomen; daarom wordt vaak een normale verdeling verondersteld voor de onderliggende (populatie)verdeling. De parameters μ en σ2 van deze normale verdeling kunnen dan benaderd worden (geschat) met resp. het steekproefgemiddelde en de steekproefvariantie s2. Zo kan men een schatting maken van de gemiddelde lengte van Nederlandse mannen en de standaarddeviatie van de verdeling door een steekproef van een honderdtal mannen te nemen en daarvan de lengte te meten. De wiskunde vertelt ook hoe nauwkeurig in zo'n geval een benadering is voor μ en hoe nauwkeurig s2 een benadering is voor σ2.
Andere voorbeelden van grootheden die als normaal verdeeld beschouwd kunnen worden, zijn:
- de maximumtemperatuur op 5 augustus in De Bilt, gemeten over verschillende jaren
- de afwijking van klokken van één bepaald merk in seconden per dag
- de intelligentie van een grote groep proefpersonen van dezelfde leeftijd
- ...
Bij medische laboratoriumtests wordt dikwijls aangenomen dat de bij gezonde proefpersonen gevonden waarden een normale verdeling vertonen. De waarden binnen een afstand van 2 * de standaarddeviatie van het midden worden dan "normaal" genoemd. Volgens deze definitie wordt bij 5% van de gezonde mensen een abnormale waarde gevonden.
[bewerk] Normale benadering
In een groot aantal gevallen kan een verdeling benaderd worden door een geschikt gekozen normale verdeling. In het bijzonder in die gevallen waarin de centrale limietstelling van praktische toepassing is. Zo kan een binomiale verdeling met parameters n en p, voor grotere waarden van n en gemiddelde waarden voor p, benaderd worden door een normale verdeling met dezelfde verwachting en variantie als de binomiale, dus door een N(np,np(1-p))-verdeling. In de figuur is dit geschetst voor n=48 en p=0,25. Als X een stochastische variabele is met de genoemde binomiale verdeling, kunnen we X praktisch als N(12,9)-verdeeld beschouwen. Dan is:
- .
Hierin is Y N(12,9)-verdeeld, Z standaardnormaal en Φ de standaardnormale verdelingsfunctie. De benadering is beter als de zgn. continuïteitscorrectie wordt toegepast. Deze berust op de vaststelling dat , maar de bijbehorende benaderingen en P(Y < 16) enigszins verschillen. Als betere benadering neemt men: .
[bewerk] Bivariate normale verdeling
De eendimensionale normale verdeling heeft equivalenten in meer dimensies; deze worden multivariate normale verdelingen genoemd. De bivariate normale verdeling, dus in twee dimensies, wordt bepaald door 5 parameters, μ, σ, ν, τ en ρ, die respectievelijk de verwachting en standaardafwijking in de eerste en tweede dimensie voorstellen en de correlatiecoëfficiënt tussen beide dimensies. Men noteert hiervoor wel: N(μ,σ2,ν,τ2,ρ)-verdeling. De kansdichtheid is:
- .
De structuur van de formule is beter te zien voor de N(0,1,0,1,ρ)-verdeling. Dan is de kansdichtheid:
- .
Zie ook multivariate normale verdeling.
[bewerk] Andere verdelingen
De normale verdeling is geen goede beschrijving voor een populatie die is opgebouwd uit verschillende subpopulaties, waardoor soms een meertoppige verdeling ontstaat.
Ook is de normale verdeling geen goede beschrijving voor verdelingen waarbij een klein aantal heel grote afwijkingen mogelijk is. Men spreekt dan van dikke staarten. In dat geval kan soms de t-verdeling gebruikt worden.
Kansverdelingen |
---|
Discrete verdelingen: Bernoulli · Binomiaal · Geometrisch · Hypergeometrisch · Negatief-binomiaal · Poisson · Uniform · Zeta Continue verdelingen: Beta · Chi-kwadraat · Exponentieel · F-verdeling · Gamma · Lognormaal · Normaal · Pareto · Student-t · Uniform · Weibull Meerdimensionale verdelingen: Multinomiaal · Multivariaat normaal |