Betrouwbaarheidsinterval
Een betrouwbaarheidsinterval is in de statistiek een intervalschatting voor een parameter. In tegenstelling tot een puntschatting geeft een betrouwbaarheidsinterval een heel interval van betrouwbare waarden (schattingen) van de parameter. Een betrouwbaarheidsinterval is een realisatie van een stochastisch interval, dat overigens zelf ook met betrouwbaarheidsinterval wordt aangeduid. De ondergrens en de bovengrens van het stochastische interval zijn stochastische variabelen, die dus bij elke herhaling van het experiment een (mogelijk) andere waarde aannemen. De te schatten parameter daarentegen heeft een, weliswaar onbekende, maar vaste waarde. Van alle realisaties van het interval zullen sommige de parameter wel bevatten, maar sommige ook niet. Hoe groter de betrouwbaarheid, hoe "vaker" het interval de parameter bevat. De kans dat een waargenomen interval de parameter bevat, heet de betrouwbaarheid van het interval. De onder- en de bovengrens worden berekend uit de steekproefgegevens, en wel zo dat er een sterk vermoeden is dat de echte waarde van de populatieparameter zich ertussen bevindt.
Definitie
bewerkenDe stochastische variabelen vormen een steekproef uit een verdeling met onbekende parameter . Als voor de steekproeffuncties en geldt:
- ,
heet het (stochastische) interval een betrouwbaarheidsinterval voor met betrouwbaarheid of een -betrouwbaarheidsinterval. Hierin is de parameter zelf geen stochastische variabele. Voor de realisaties en van respectievelijk en geldt dezelfde kansuitspraak uiteraard niet. Men zegt:
- "met betrouwbaarheid geldt: ".
Als de grenzen van het betrouwbaarheidsinterval uit de steekproef kunnen worden berekend, zijn het dus steekproeffuncties en daarom zelf ook stochastische variabelen.
Interpretatie
bewerkenWat betekent een uitspraak: "met betrouwbaarheid 95% ligt de parameter in het waargenomen interval "?
Gezien de definitie houdt dit in dat in 95% van de keren dat het interval op dezelfde manier wordt waargenomen, de parameter in het gevonden interval ligt. De parameter heeft steeds dezelfde onbekende waarde, maar iedere keer wordt een (meestal) ander interval waargenomen. In een grote serie waargenomen intervallen zullen van de intervallen ruwweg 95% de parameterwaarde bevatten.
Of het gevonden betrouwbaarheidsinterval de parameter bevat, blijft in het algemeen onbekend. De parameter ligt er wel of ligt er niet in. Het is dus foutief te zeggen dat met kans 95% de parameter in het gevonden interval ligt.
Voorbeelden
bewerkenVoorbeeld 1: Verkiezingen
bewerkenOm een beeld te krijgen van de opkomst bij de naderende verkiezingen, is een enquête onder 1000 aselect gekozen stemgerechtigden gehouden. Van deze steekproef zeiden 700 ondervraagden te zullen gaan stemmen. Het opkomstpercentage is natuurlijk een nog onbekende parameter . Een voor de hand liggende (punt)schatting van is: 0,70. Maar het kan ook wat meer of minder zijn. Mogelijk 0,75 of 0,60. Is het aannemelijk dat het 0,50 zou zijn? Om deze vraag te beantwoorden zoekt men een interval , waarvan met een zekere mate van betrouwbaarheid gezegd kan worden dat daarin zal liggen. Met 100%-betrouwbaarheid kan men zeggen dat tussen 0 en 1 zal liggen, maar dat geeft geen informatie. Maar wat is de betrouwbaarheid van het interval [0,65; 0,75]? En hoe moeten de grenzen worden gekozen, als een betrouwbaarheid van 95% gewenst is?
Noem het aantal stemgerechtigden die zeggen te gaan stemmen. is een stochastische variabele met een binomiale verdeling met parameters en kans dat iemand gaat stemmen. Voor de steekproeffuncties:
en
- ,
waarin de steekproeffractie is, geldt:
Het interval is dus een 0,95-betrouwbaarheidsinterval voor . Omdat voor de waarde 700 gevonden is, kunnen de realisaties en van respectievelijk en berekend worden:
en
Men zegt daarom dat met betrouwbaarheid (let wel: niet met kans) 0,95 geldt dat .
Voorbeeld 2: Kuipjes vullen
bewerkenEen machine vult kuipjes margarine en is zo ingesteld dat in elk kuipje 250 gram margarine moet komen. Natuurlijk is het niet mogelijk om ieder kuipje met precies 250 gram te vullen. Het vulgewicht is een stochastische variabele , waarvan wordt aangenomen dat die een normale verdeling heeft met verwachting en, voor de eenvoud, bekende standaardafwijking gram. Om de afstelling van de machine te controleren neemt men een steekproef van aselect gekozen kuipjes en weegt die. De gewichten aan margarine zijn , een aselecte steekproef van .
Om alleen maar een indruk te krijgen van de verwachting , is het voldoende een schatting te geven. Het steekproefgemiddelde
is daarvoor geschikt. Maar kunnen er ook grenzen bepaald worden waartussen de parameter met een zekere waarschijnlijkheid ligt? Is er een betrouwbaarheidsinterval voor ?
De gewichten , die in de steekproef zijn gemeten, hebben een gemiddelde van:
- gram.
Dat is een min of meer toevallige waarde. Het had ook 250,4 of 251,1 gram kunnen zijn. Een waarde van 280 gram is daarentegen weer onwaarschijnlijk. Er is een heel interval rond het waargenomen gemiddelde van 250,2 met schattingen die ook betrouwbaar zijn, dat wil zeggen waarvan tamelijk zeker is dat de parameter in dat interval ligt. Tamelijk zeker, want absoluut zeker is alleen het interval (0,∞), maar dat is triviaal.
In ons geval kunnen de grenzen bepaald worden door te bedenken dat het steekproefgemiddelde van een normaal verdeelde steekproef, zelf ook normaal verdeeld is, met dezelfde verwachting , maar met standaardafwijking gram. Het gestandaardiseerde gemiddelde is:
- ,
dat zelf van afhangt, maar standaardnormaal is verdeeld, dus met een verdeling onafhankelijk van de te schatten parameter . Er is daarom een getal , onafhankelijk van , zodanig dat het gestandaardiseerde gemiddelde met een voorgeschreven kans tussen en ligt. De betrouwbaarheid geeft aan hoe betrouwbaar het interval gevonden wordt. Voor de keuze krijgt men:
Het getal volgt uit:
- ,
dus , en er geldt:
De interpretatie hiervan is: met kans 0,95 wordt een interval gevonden met stochastische grenzen
en
- ,
waar tussenin ligt.
Elke keer dat de metingen worden herhaald, vindt men een andere waarde voor het steekproefgemiddelde . In 95% van de gevallen zal tussen de met dit gemiddelde berekende grenzen liggen, in 5% van de gevallen echter ook niet. Het actuele betrouwbaarheidsinterval wordt berekend door de waarden van de gevonden gewichten in te vullen. Het 0,95-betrouwbaarheidsinterval voor is:
In de onderstaande figuur zijn 50 realisaties van een betrouwbaarheidsinterval met betrouwbaarheid 95% voor een onbekende parameter aangegeven.
De meeste, in doorsnee 95%, van deze intervallen bevatten de parameter. Enkele daarentegen ook niet. In de praktijk hebben we te maken met een van deze intervallen. Welke dat is weten we niet. Toen we de steekproef namen, hadden we een kans van 95% om een interval te vinden waarin zich de parameter bevindt. Daarom zeggen we dat de parameter met betrouwbaarheid 95% in dit interval ligt. Daarmee bedoelen we niets meer dan dat.
Betrouwbaarheidsintervallen bij verschillende verdelingen
bewerkenNormale verdeling
bewerkenLaat een aselecte steekproef uit de normale verdeling zijn, het steekproefgemiddelde en de variantie.
Bij bekende variantie wordt een -betrouwbaarheidsinterval voor gegeven door:
- ,
met het -fractiel van de standaardnormale verdeling, dus .
Als niet bekend is, wordt deze geschat, en wordt het -betrouwbaarheidsinterval voor :
- ,
met het -fractiel van de -verdeling.
Een -betrouwbaarheidsinterval voor is:
met en respectievelijk het - en het -kwantiel van de -verdeling.
Exponentiële verdeling
bewerkenLaat een aselecte steekproef zijn uit de exponentiële verdeling met verwachting en het steekproefgemiddelde.
Een -betrouwbaarheidsinterval voor wordt gegeven door:
- ,
met en respectievelijk het - en het -kwantiel van de -verdeling.
Binomiale verdeling
bewerkenLaat binomiaal verdeeld zijn met parameters en , en een schatter van .
Voor relatief grote wordt een benaderend -betrouwbaarheidsinterval voor gegeven door:
- ,
met het -kwantiel van de standaardnormale verdeling, dus .
Poissonverdeling
bewerkenLaat Poisson-verdeeld zijn met verwachtingswaarde . Uit de relatie tussen de verdelingsfuncties van de Poissonverdeling en de chi-kwadraatverdeling kan het volgende -betrouwbaarheidsinterval voor afgeleid worden:
- ,
met het -kwantiel van de -verdeling.
Websites
bewerken- (en) Interpreting Confidence Intervals. visualisatie van gesimuleerde betrouwbaarheidsintervallen