7 ”Lack of fit”-test

Statistisk analyse og biologisk tolkning af toksicitetsdata

7.1 Test baseret på kumulerede residualer
7.2 Afsluttende bemærkninger

Når der er replikater inden for doseringer i et bioassay har vi mulighed for at sammenligne regressionsanalysen med en mere generel model (ofte en variansanalyse), dvs. udføre et lack-of-fit-test af dosis-responsmodellen. En variansanalysemodel tager ikke højde for, hvorledes den funktionelle sammenhæng imellem respons og dosis ser ud. Derimod forudsætter regressionsanalysen, som det er vist gentagne gange i denne rapport, at vi kender den funktionelle sammenhæng og at vi kan beskrive denne med en matematisk model. Hvis en sammenligning mellem regressions- og variansanalysemodellen ikke er signifikant vurderet ud fra et F-test, så betyder det, at der ikke er grund til at tro at regressionsanalysen ikke er lige så god til at beskrive variationen i data som variansanalysen (Draper and Smith 1981). Dosis-responsmodellen foretrækkes, idet den beskriver data vha. færre parametre. F-testet giver således en god indikation af kvaliteten af en regressionstilpasning. I næste afsnit betragter vi et lack-of-fit-test, der kan bruges når man ikke har replikater og derfor ikke kan anvende en variansanalyse.

7.1 Test baseret på kumulerede residualer

Et attraktivt alternativ til lack-of-fit-testet er testet baseret på de kumulerede residualer. Hvis de rå residualer kaldes e_i og de anvendte doseringer x_i, så er testet baseret på følgende sum:

(7.1)

hvor I(x_i=x) er en indikatorfuntion (den er 0 hvis x_i er større end x og 1 ellers). W_n(x) kan beregnes for hver værdi x i doseringsintervallet (vi siger, at vi har en proces i x). Det er således muligt at tegne processen W_n(x) op som en funktion af dosering. Et test kan baseres på maksimum for W_n(x): Hvor stor er maksimum i forhold til hvad man ville forvente såfremt modellen er rigtig. Det er nemt at simulere fordelingen af maksimum af W_n(x). Tests baseret på kumulerede residualer findes for lineær regression (Su & Wei, 1991), generaliseret lineær regression (Lin et al, 2002) og for modeller i overlevelsesanalyse (Lin et al, 1993). En stor fordel ved dette test er, at der ikke kræves gentagelser ved de enkelte doseringer. Testet er implementeret i R-pakken drc og i Figur 7.1 ses. de kumulerede residualer som funktion af dosis.

For det betragtede datasæt (se afsnit 9, datakilde 1 for en detaljeret beskrivelse af datasættet) fås nedenstående plot af den observerede W_n(x) (den fuldt optrukne kurve). Ud over selve den observerede proces er der også indtegnet 20 simulerede processer (de stiplede linjer) for at vise hvor meget processen må variere såfremt modellen er rigtig. P-værdien baseret på 1000 simulerede processer er 0,07, som modsat p-værdien fra det ANOVA-baserede lack-of-fit-test på 0,0009, ikke tyder på nogen markant afvigelse fra modellen.

Lack-of-fit-testet bygger på den antagelse, at der er varianshomogenitet dvs. at variationen i responsen er den samme for alle doseringer. Denne antagelse kan ikke undersøges i situationer, hvor der kun er gentagelser i kontrolgruppen (dosering 0); ved vi overhovedet intet om variationen for alle de andre doseringer. I ovennævnte eksempel er variationen temmelig lille i kontrolgruppen, og på den baggrund behøver afvigelser mellem observationer og den estimerede log-logistiske model til de andre doseringer ikke at være særligt store for at kunne give et signifikant lack-of-fit-test. Hvis omvendt variationen i kontrolgruppen er rigtig stor, så vil lack-of-fit-testet resultere i en p-værdi tæt på 1, et ikke-signifikant resultat.

Figur 7.1. Kumulerede residualer er indtegnet som funktion af dosis (sort linje). De stiplede linjer svarer til 20 simulerede processer. Der ser generelt ud til at være en god overensstemmelse mellem de observerede og simulerede kumulerede residualer.

7.2 Afsluttende bemærkninger

Det er muligt at udføre et lack-of-fit-test, uanset om der er replikater af de anvendte doseringer. Generelt vil testene dog have lav styrke for små datasæt, men ved at øge antallet af doseringer vil nogle at testene få en ganske betydelig styrke. Dette er en af konklusionerne i Ritz & Martinussen (2008), hvor lack-of-fit-test for dosis-responsmodeller sammenlignes. En anden hovedkonklusion er, at testene ikke bliver meget bedre af, at der er flere replikater for et fast antal doseringer, men det gør de til gengæld, hvis antallet af doseringer øges.