Hypothese toetsen II

  1. De Wald test
  2. p-Waarde scan

In module 3 hebben we uitgelegd hoe het toetsen van een hypothese in zijn werk gaat. We hebben gezien dat er vier belangrijke stappen zijn. Eerst stellen we de hypothese op die we willen toetsen en ook de nulhypothese. Vervolgens is het belangrijk om een statistiek te vinden die gevoelig is voor de stelling. Met andere woorden, een statistiek waarmee we de hypothese kunnen toetsen. We kiezen vervolgens een significantieniveau (pp-waarde) waarbij we H0H_0 of HαH_\alpha kunnen verwerpen. Daarna meten we de p-waarde met behulp van een meting en bekijken we of we de H0H_0 stelling kunnen verwerpen. We hebben ook gezien wat de zz-score betekent.

In dit hoofdstuk leggen we nu een bijzondere vorm van hypothese toetsen uit waarbij we gebruik maken van de kleinste kwadraten methode en de daarbij berekende χ2\chi^2.

De Wald test

De Wald test is een bijzondere test die kan worden gebruikt om met behulp van de kleinste kwadraten methode een hypothese te toetsen.

We definiëren twee functies. De eerste functie, f0f_0, beschrijft de dataset onder de hypothese H0H_0, de tweede functie, fαf_\alpha, beschrijft de dataset onder de alternatieve hypothese HαH_\alpha. Vervolgens fitten we beide functies aan een gemeten dataset. Het verschil in de geminimaliseerde χ2\chi^2 voor beide functies definiëren we als

Δχ2=χ02χα2.\Delta \chi^2 = \chi^2_0 - \chi^2_\alpha.

Dit chi-kwadraat verschil (Δχ2\Delta \chi^2) gebruiken we vervolgens om een p-waarde te berekenen, met behulp van een opzoektabel, en de hypothese toets uit te voeren.

Bij de Wald test gelden strikte voorwaardes voor het opstellen van de twee functies. De functies mogen slechts in één vrije parameter verschillen, verder moeten ze geheel identiek zijn. De H0H_0 hypothese wordt hierbij beschreven met het minste aantal vrije parameters. Alle parameters die H0H_0 kent, kent HαH_\alpha ook.

Voorbeeld: Opstellen functies Als de nulhypothese wordt beschreven door een functie f0(x;a,b)f_0(x;a,b) dan wordt de alternatieve hypothese beschreven door een functie fα(x;a,b,c)f_\alpha(x;a,b,c) waarbij de parameters aa en bb identiek zijn en ook de relatie tussen xx en deze twee parameters gelijk is.

Als aan de bovengenoemde voorwaarde wordt voldaan dan wordt de Δχ2\Delta \chi^2 beschreven door een χ2\chi^2 functie met vrijheidsgraad n=1n=1. En zoals we in module 3 hebben beschreven is de χ2\chi^2 zelf een kansdichtheidsverdeling. We kunnen in dat geval de bepaalde Δχ2\Delta \chi^2 direct omrekenen naar een waarschijnlijkheid, en deze is gelijk aan de p-waarde van de hypothese toets.

Voorbeeld: Wald test Stel dat we met behulp van spectroscopie willen onderzoeken of een chemisch element XX aanwezig is in een sample. Als het chemische element XX aanwezig is dan verwachten we een verhoogde intensiteit te zien bij de emissielijn van het specifieke element. We verwachten ook een achtergrondspectrum te zien. Dat wil zeggen we meten over alle golflengtes normaal gesproken een bepaalde intensiteit, ook zonder dat het chemische element aanwezig is. We kunnen nu de twee functies opstellen, één die het achtergrondspectrum beschrijft (I0I_0) en één die de emissielijn beschrijft (IαI_\alpha).

Stel dat de achtergrond een lineaire functie volgt

I0(λ;a,b)=a+bλ.I_0(\lambda;a,b) = a+ b\cdot \lambda.

Waarbij λ\lambda de golflengte is.
De emissielijn van XX, verwachten we rond 930 nm en de resolutie van de spectroscoop is 1 nm. De intensiteit van de emissielijn wordt dan beschreven door:

Iα(λ;J,λ0,σ)=J1σ2πe12(λλ0σ)2.I_\alpha(\lambda;J,\lambda_0, \sigma) = J \cdot \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2}\left(\frac{\lambda - \lambda_0}{\sigma}\right)^2}.

We zien dat er in de functie die de emissielijn beschrijft precies één vrije parameter is, namelijk JJ die de intensiteit van de signaalpiek beschrijft. De andere parameters λ0\lambda_0 en σ\sigma zijn bekend en worden in de fit dus niet vrijgelaten.

De functie f0f_0 wordt in dit geval gelijkgesteld aan de functie die de verwachte intensiteit van de achtergrond (of nulhypothese) beschrijft: f0=I0f_0= I_0. De vrije parameters in deze fit zijn aa en bb.

De functie fαf_\alpha die de alternatieve hypothese beschrijft is nu gelijk aan de verwachte achtergrond, plus de eventuele aanwezige emissielijn van het element XX (het signaal): fα=I0+Iαf_\alpha = I_0 + I_\alpha. De vrije parameters in deze fit zijn a,ba,b en JJ. Er is dus maar één parameter verschillend ten opzichte van f0f_0 en we voldoen dus aan het criterium van de Wald methode.

We spreken af dat we de nulhypothese mogen verwerpen als de p-waarde kleiner is dan 1106.1 \cdot 10^{-6}.



We voeren nu ons experiment uit en fitten de dataset met de functie f0f_0 en met de functie fαf_\alpha. Het verschil in de geoptimaliseerde χ2\chi^2’s voor de nul- en de alternatieve hypothese is gelijk aan Δχ2=χ02χα2\Delta \chi^2 = \chi^2_0 - \chi^2_\alpha.

Het waargenomen spectrum met de gefitte lijn.

In de grafiek zien we een duidelijk piekje rond 930 nm, precies waar we het signaal van het chemische element XX door HαH_\alpha voorspeld is. De fit resultaten van beide hypotheses zijn in het plaatje weergegeven. Met het verschil in χ2\chi^2 kunnen we nu een p-waarde uitrekenen. In dit geval is die gelijk aan 1.61081.6\cdot 10^{-8}. Het is dus uitermate waarschijnlijk dat we het chemische element XX hebben aangetoond in de spectraalanalyse.

De berekende p-waarde wordt vaak weer omgerekend in een zz-score. De reden waarom dit gedaan wordt is omdat de waardes van de zz-score over het algemeen wat makkelijker liggen. Het is zeg maar een handigere manier om een kans uit te drukken. In het voorbeeld hierboven komt de kans van 1.61081.6\cdot 10^{-8} overeen met een zz-score van 5.5. Ga maar na, het laatste spreekt een stuk makkelijker uit.

In het voorbeeld hierboven hebben we een nulhypothese (waarbij alleen een achtergrondspectrum aanwezig is) vergeleken met alternatieve hypothese waarbij een element XX bestaat en we de emissielijn meten in het spectrum. We hebben een kans gevonden (de p-waarde) van 1.61081.6\cdot 10^{-8} dat de geobserveerde dataset past bij de nulhypothese. Dit is een uitermate kleine kans en omdat deze kleiner is dan het vooraf afgesproken significantieniveau mogen we de nulhypothese verwerpen.

p-Waarde scan

In het voorbeeld hierboven is er een duidelijke stelling over de golflengte van de emissielijn van het element XX, namelijk λ0=930\lambda_0= 930 nm. Stel nu dat dat niet zo is, dat we niet weten bij welke golflengte we de emissielijn zouden waarnemen. In dat geval zouden we een extra vrije parameter hebben in de functie die HαH_\alpha beschrijft. Omdat we dan meer dan 1 vrije parameter hebben kunnen we de Wald methode niet toepassen. Wat we in dat geval wèl kunnen doen is een zogeheten p-waarde scan uitvoeren. We fixeren dan telkens de waarde van de golflengte van de emissielijn en berekenen voor elk van deze golflengtes de p-waarde. Als er een emissielijn aanwezig is die sterk genoeg is zullen we op die locatie een dip zien in de p-waarde.

We moeten ook bij deze toets van tevoren bepalen bij welke p-waarde we de nulhypothese verwerpen.

Voorbeeld: p-waarde scan Nu voeren we een vergelijkbaar experiment uit met een spectrometer en is er een deeltje Y dat we wellicht kunnen waarnemen. Echter, in dit geval is er geen voorspelde waarde van de golflengte λ0\lambda_0, ook kennen we de verwachte intensiteit niet. We kunnen de Wald test hierdoor niet zomaar uitvoeren. Immers moeten we precies één vrije parameter extra fitten in de HαH_\alpha hypothese ten opzichte van de H0H_0 hypothese, en we zouden nu zowel JJ als λ0\lambda_0 moeten fitten.

De oplossing vinden we door één van de parameters te fixeren, deze houden we constant. We kunnen dan de p-waarde scannen als functie van de gefixeerde parameter. In het voorbeeld hier scannen we over de golflengte λ0\lambda_0. Voor elke gekozen (en gefixeerde) waarde van λ0\lambda_0 kunnen we de Wald test uitvoeren en de p-waarde berekenen. Door steeds een andere waarde van λ0\lambda_0 te kiezen en de berekeningen van de Wald test te herhalen, kunnen we langzaam over het gemeten spectrum scannen.

We laten de fit nu voor vier waardes van λ0\lambda_0 zien. Voor elke waarde van λ0\lambda_0 fitten we nu de twee functies waarbij we er even van uitgaan dat de spectraallijn van element Y zich precies daar bevindt.

Het waargenomen spectrum met de gefitte lijn voor waardes van $$\lambda_0$$ bij = 930, 940, 968 en 990 nm.

We zien voor de fit met waarde λ0=930 nm\lambda_0 = 930~\text{nm} dat de Δχ2\Delta \chi^2 gelijk is aan 0. Maar als we goed kijken in het plaatje zien we ook geen enkel piekje bij λ=930 nm\lambda=930~\text{nm}. Bij de waardes van λ=940\lambda = 940 en 980 nm980~\text{nm} zien we wel een klein piekje. Maar vooral bij de waarde van λ=968 nm\lambda = 968~\text{nm} is een grote piek te vinden.

Als we alle p-waardes van de scan (maar dan over alle waardes van λ0\lambda_0) nu grafisch weergeven dan krijgen we het volgende resultaat.

De p-waarde scan van de emissiedata.

Je ziet nu dat er op een aantal plekken in het spectrum een kleine afwijking van de H0H_0 hypothese te zien is. Deze komen allemaal overeen met golflengtes waar op het oog een piekje zichtbaar lijkt. Op slechts één locatie is er een heel duidelijke afwijking zichtbaar, precies bij 968 nm. De Δχ2\Delta \chi^2 is op dat punt 21.4 en dit kunnen we omrekenen naar een p-waarde van 3.7106.3.7 \cdot 10^{-6}.

Eigenlijk hadden we van tevoren ook bij dit experiment een significantieniveau moeten afspreken waarbij we de aanwezigheid van het chemische element kunnen aantonen. Zodra de gemeten p-waarde onder deze afgesproken significantie zakt in de p-waarde scan kunnen we claimen het element te hebben aangetoond. Als we hem weer bij een waarde van 11061 \cdot 10^{-6} hadden afgesproken hadden we ook in de p-waarde scan het element YY kunnen claimen.

De Wald test is een krachtige methode om hypotheses te toetsen.