Dokumentation af interne og eksterne kilder til tetrachlorethylen i boliger Bilag 6: Statisk analyseStatistisk analyse af perklor-dataDe anvendte variable
Plot af conc i et histogram viste, at data ikke er normalfordelte. Se figur 1. Fordelingen synes tættere på en logaritmisk normalfordeling, hvilket et histogram af ln(conc) bekræftede (ikke vist). Det blev derfor besluttet at modellen skulle baseres på ln(conc) fremfor conc. Figur 1 Korrelation mellem uafhængige variable Før den statistiske analyse blev de afhængige variable undersøgt for korrelation (afhængighed). Hvis værdierne af to uafhængige variable korrelerer er det ikke muligt at skelne effekterne for de to variable. De to variable kan erstatte hinanden i den statistiske model, uden at det ændre modellen. Derudover kræver den statistiske modellering at der ingen korrelation er mellem værdierne af de uafhænge variable. For dikotomiserede variable blev den indbyrdes afhængighed testet med Fischers eksakte test. Signifikanskriterium var P<0.05. For kontinuerte variable blev den indbyrdes afhængighed undersøgt ved at teste korrelationskoefficienten. Der blev observeret en signifikant afhængighed mellem værdierne for Virksom2 og B_Type, se tabel 1. Uforholdsvis mange (n=4) af de perklorforbrugende virksomheder indenfor en radius af 2 km findes for boligtypen lejligheder (B_type=0). Tabel 1
Tabel 2
Model Initial model: ![]() Det blev besluttet at anvende variablen B_type i stedet for variablen Virksom2 (som korrelerer med B_type) idet der er flere observationer med værdier for B_type end med værdier for Virksom2 (6 manglende observationer). Modellen kan ikke teste indflydelsen fra personer beskæftiget på perklorforbrugende virksomheder, idet variablen Beskaeft korrellerer med variablen B_Type. Modellen kan heller ikke teste effekten af antal kemisk rensede tekstiler per år (per kvadratmeter boligareal) (variablen T_per_m2) idet denne korrellerer med variablen T_period (det er de samme husstande som har modtaget kemisk rensede tekstiler i måleperioden som renser de fleste tekstiler per år). Det blev besluttet ikke at inkludere variablene Udluft1 og Udluft2, dels for de ikke er objektive, dels kan de være positivt korrelerede med antallet af kemiske rensede tekstiler per år (jo hyppigere man renser tøj, jo mere lufter man ud). I stedet anvendes den objektive variabel Ventil1 som et mål for luftudskiftning. Bemærk, at den initiale model inkluderer en vekselvirkning mellem Ventil1 og T_period, idet ventilationen kan forventes kun at være effektiv, når perklor-koncentrationen er høj (dvs. når der er et kemisk renset tekstil i husstanden). Estimater af m og b i blev estimeret med PROC MIXED proceduren i SAS (alle variable behandlet som "Fixed effects"). Kriterier for at fjerne en variabel: Koefficient ikke signifikant forskellig fra 0 (P>0.10) og variablen har ingen signifikant indflydelse på modelfit (vurderet ved værdien af 2 RES LOG LIKELIHOOD, som er c 2-fordelt ). Kriterium for at acceptere den lineær model er at residualerne er uafhængige af koncentrationsniveauet og er normalfordelte. Det første vurderes grafisk, det sidste testes med Anderson-Darling test (signifikanskriterium P<0.05). Endelig model: Estimater: Tabel 3
Parcelhus (B_type = 1), uden udluftningsventiler (Ventil1 = 0) og hvor husstanden i de sidste 2 uger ikke har modtaget kemisk rensede tekstiler (T_period =0):
Bemærk, at effekten for udluftningventiler (b4 = 0.115) ikke indgår i beregningerne, idet den ikke er signifikant forskellig fra nul. Hvis der findes udluftningsventiler, afhænger niveauet af hvor de er placeret. Modellen predikterer koncentrationen i det "væsentligste opholdsrum" (stue, evt. køkken/alrum) og udluftningsventilerne vægtes efter om de er placeret i dette rum, tilstødende rum eller andre rum i huset. Tag fx et parcelhus (B_type = 1), med udluftningsventiler i stue (score 3) og tilstødende rum (score 2) (Ventil1 = 3+2 =5) og hvor husstanden i de sidste 2 uger har modtaget kemisk rensede tekstiler (T_period =1):
Uden udluftningsventiler vil den predikterede koncentration i samme situation være 2.6 m g/m3. Multiplikativ model I stedet for at regne i logaritmer kan ovenstående model formuleres som en multiplikativ model: Conc = m 0·fB_type·fventil1·fT_period·fVekselvirkning hvor faktorerne har følgende værdier: Tabel 4
(*) 90% konfidensintervallet er 0.3 0.95. Diskussion Effekten af boligtype kan skyldes større bidrag udefra i bymæssig bebyggelse fra renserier og metalforarbejdende virksomheder, eller bidrag fra omkringliggende lejligheder. Mht. til den første forklaring var variablen Virksom1 ikke signifikant. En statistisk analyse baseret på en model med variablen Virksom2 i stedet for B_type gav heller ikke signifikans for Virksom2. Dette kan dog skyldes, at der var mange manglende observationer for denne variabel. Selvom de signifikante effekter ser "naturlige" ud, så er analysen baseret på ret få observationer. Det er ikke undersøgt hvor robust den gennemførte analyse er for ændringer i en eller få af de indgående variable.
Arbejsmiljøinstituttet Jesper Kristiansen
|