Diffus jordforurening og trafik

4 Statistisk analyse af Hareskovvej

Formålet med denne statistiske analyse er at belyse relationer/korrelationer mellem koncentrationerne af bly, chrom, kobber, nikkel, zink, benzo(a)pyren og sum af PAH i jordprøver udtaget i varierende afstand og dybde i forhold til en trafikeret vej. Analysen er baseret på data for prøver udtaget langs Hareskovvej, idet der her er indsamlet flest data og påvirkning fra andre kilder er minimal.

4.1 Deskriptiv statistik

Målepunkterne dækker et areal udspændt af 1148 m (i øst-vest (x)-retningen) gange 1206 m (i nord-syd (y)-retningen). Alle 213 kombinationer af afstande og dybder er plottet ind i figur 4.1. For at give et bedre visuelt indtryk af kombinationer af afstand og dybde er overlappende punkter forskudt en smule (både vertikalt og horisontalt). Grundet manglende observationer vil en beskrivelse af sammenhænge for store afstande og dybder være behæftet med stor usikkerhed.

Figur 4.1 Målepositioners dybde (meter) og afstanden (meter) fra vejen.

Figur 4.1 Målepositioners dybde (meter) og afstanden (meter) fra vejen.
The sampling position as related to distance from road verge and depth in soil

Mulige dataanalyser er i figur 4.1 afmærket med følgende farver:

Rød : Afstand for små dybder
Grøn : Dybde for små afstande
Blå : Moderate dybder og afstande

Målepunkternes geografiske position samt dybde er plottet ind i figur 4.2. Som det ses af figur 4.2, er prøverne udtaget med forskellige afstande og dybder i de forskellige prøvetagningstværsnit. Det er derfor vanskeligt at skille variationen, der skyldes afstand eller dybde, og variationen eller særlige forhold langs de pågældende tværsnit.

Klik her for at se figuren.

Figur 4.2. Målepunkternes positioner vist som funktion af dybde
Sampling positions shown as a function of depth

I tabel 4.1 angives deskriptive statistikker for samtlige datapunkter.

  Antal Min gns. median Max Std. afv.
Bly 213 7 116 69 510 110
Chrom 213 5 25 24 130 18
Kobber 213 7,7 52 37 410 56
Nikkel 213 2,5 9 8 230 81
Zink 213 24 130 110 490 1500
BaP 213 0,002 0,35 0,068 18 1,5
PAH 213 0,006 1,3 0,36 38 3,6

gns. : gennemsnit Std. afv. : standardafvigelse

Tabel 4.1 Deskriptive statistikker for samtlige datapunkter – Hareskovvej
Descriptive statistics for all data – Hareskov road

Som det ses af tabel 4.1, er gennemsnitsværdi og medianer væsentligt forskellige og fordelingerne højreskæve (lang højre hale). I tabel 4.2 er angivet statistikker for de log10-transformerede data.

  Antal Min 1. kvartil
(25%)
gns. median 3. kvartil
(75%)
Max Std. afv.
log10Bly 213 0,85 1,56 1,88 1,84 2,25 2,71 0,42
log10Chrom 213 0,7 1,02 1,27 1,38 1,56 2,11 0,36
log10Kobber 213 0,89 1,42 1,61 1,57 1,72 2,61 0,28
log10Nikkel 213 0,4 0,4 0,78 0,90 1,04 2,37 0,35
log10Zink 213 1,38 1,89 2,06 2,05 2,22 2,69 0,25
log10BaP 213 -2,70 -1,44 -1,12 -1,17 -0,70 0,90 0,65
log10PAH 213 -2,22 -0,69 -0,38 -0,44 0,041 1,58 0,64

gns. : gennemsnit Std. afv. : standardafvigelse

Tabel 4.2 Deskriptive statistikker for log10-transformerede data – Hareskovvej
Descriptive statistics for log10 transformed data – Hareskovvej

I den følgende dataanalyse anvendes de log10-transformerede data. Med henblik på at belyse korrelationen mellem parametrene er alle data plottet mod hinanden, se figur 4.3.

Klik her for at se figuren.

Figur 4.3 Scatterplot af de log10-transformerede værdier for alle parametre
Scatter plot of log10-transformed parameters

Som det ses af figur 4.3, er der næsten 100% korrelation mellem BaP og sum af PAH.

For chrom og nikkel betyder de mange målinger under detektionsgrænsen, at der opstår en ret linie i alle plot med disse stoffer med henholdsvis 35 og 68 observationer med log-værdier på henholdsvis 0,7 og 0,4.

Korrelationskoefficienterne for de logaritme-transformerede data er vist i tabel 4.3.

  log10Pb log10Cr log10Cu log10Ni log10Zn log10BaP log10PAH
log10Pb              
log10Cr 0,18            
log10Cu 0,74 0,38          
log10Ni 0,15 0,14 0,23        
log10Zn 0,86 0,29 0,89 0,14      
log10BaP 0,64 0,009 0,30 0,12 0,47    
log10PAH 0,67 0,053 0,34 0,15 0,52 0,98  

- ikke beregnet

Positiv værdi (begge parametre vokser) Negativ værdi (en parameter aftager, en vokser)
> 0,87 God korrelation 0,5 - 0,71 Tvivlsom korrelation
0,71 - 0,87 Rimelig korrelation < 0,5 Ingen korrelation

Tabel 4.3 Korrelation mellem parametre
Correlation between parameters

Som det ses af tabel 4.3, er der god korrelation mellem BaP og PAH samt mellem bly, kobber og zink. Korrelationen mellem BaP/PAH og metallerne er mere tvivlsom, og ses tydeligst for bly (0,64/0,67). Der er ringe korrelation mellem krom og nikkel og de øvrige variabler.

For visuelt at undersøge om de log10-transformerede data er normalfordelte, er der i figur 4.4vist et normalfordelings-fraktilplot (Q-Q-plot).

Figur 4.4 Q-Q-plot af de log<sub>10</sub>-transformerede data

Figur 4.4 Q-Q-plot af de log10-transformerede data
Q-Q plot of the log10 transformed data

Her bemærkes igen påvirkningen fra data under detektionsgrænsen for chrom og nikkel. Yderligere bemærkes "S"-formen for benzo(a)pyren og PAH, hvilket indikerer, at selv logaritmere-værdierne udviser fordelinger med lange haler.

4.2 Analyse af koncentration, afstand og dybde

Dette afsnit beskriver indledende relationer mellem koncentration, afstand og dybde for de enkelte stoffer. Der er lavet et box-whisker plot for de enkelte stoffer, betinget af afstande og dybder, jf. figur 4.4 - 4.10.

Hver figur består af 6 delplot (1 - 6) baseret på data ved 3 afstandsintervaller:

  • 0,4 : 3,4 m - delplot 1 og 2
  • 3,4 : 9,5 m - delplot 3 og 4
  • 9,5 : 93 m - delplot 5 og 6

Inden for hvert afstandsinterval er dataene inddelt i to intervaller:

  • 0,05 : 0,1m - delplot 1, 3 og 5
  • 0,1 : 1.06 m] - delplot 2, 4 og 6

I figur 4.4 vises et box-whisker plot, hvor boksen (lyseblå) angiver intervallet mellem den 1. og 3. kvartil, som svarer til 25% og 75% fraktiler. Den røde cirkel med streg igennem inde i boksen angiver medianen. Den formodede naturlige fordeling er angivet med de øvre og nedre sorte "whiskers". Afvigende værdier er angivet med en sort cirkel og en sort streg.

Bly

Figur 4.5 Box Whisker-plot for log<sub>10</sub>(bly) betinget af afstand og dybde

Figur 4.5 Box Whisker-plot for log10(bly) betinget af afstand og dybde
Box Whisker plot for log10 transformed lead with respect to distance and depth

I figur 4.5 ses på delplot 1, 3 og 5 samt delplot 2, 4 og 6 aftagende koncentrationer med stigende afstand for såvel det øverste jordlag som for de nederste, dog tydeligst i de øverste jordlag 0,05 – 0,1 m's dybde (delplot 1, 3, og 5). For de tre afstandsintervaller, dvs. delplot 1 og 2, delplot 3 og 4 samt delplot 5 og 6 ses, at koncentrationen er lavere i de nederste jordlag.

Chrom

Figur 4.6 Box Whisker-plot for log<sub>10</sub>(chrom) betinget af afstand og dybde

Figur 4.6 Box Whisker-plot for log10(chrom) betinget af afstand og dybde
Box Whisker plot for log10 transformed chromium with respect to distance and depth

På delplot 1, 3 og 5 samt delplot 2, 4 og 6 i figur 4.6 ses ingen umiddelbar sammenhæng mellem koncentration og afstand for hverken det øverste eller de nederste jordlag. For de tre afstandsintervaller, dvs. delplot 1 og 2, delplot 3 og 4 samt delplot 5 og 6 ses heller ikke umiddelbart nogen sammenhæng mellem koncentration og dybde i de tre afstandsintervaller.

Kobber

Figur 4.7 Box Whisker-plot for log<sub>10</sub>(kobber) betinget af afstand og dybde

Figur 4.7 Box Whisker-plot for log10(kobber) betinget af afstand og dybde
Box Whisker plot for log10 transformed copper with respect to distance and depth

På delplot 1, 3 og 5 i figur 4.7 ses aftagende koncentration med stigende afstand for det øverste jordlag, men ingen umiddelbar tendens for det nederste jordlag (delplot 2, 4 og 6). For de tre afstandsintervaller, dvs. delplot 1 og 2, delplot 3 og 4 samt delplot 5 og 6 ses, at koncentrationen for afstandsinterval 0,4-3,4 m (delplot 1 og 2) og til dels ved 3,4 – 9,5 m (delplot 3 og 4) er lavere i de nederste jordlag.

Nikkel

Figur 4.8 Box Whisker-plot for log<sub>10</sub>(nikkel) betinget af afstand og dybde

Figur 4.8 Box Whisker-plot for log10(nikkel) betinget af afstand og dybde
Box Whisker plot for log10 transformed nickel with respect to distance and depth

For nikkel ses ingen umiddelbare tendenser, se figur 4.8.

Zink

Figur 4.9 Box Whisker-plot for log<sub>10</sub>(zink) betinget af afstand og dybde

Figur 4.9 Box Whisker-plot for log10(zink) betinget af afstand og dybde
Box Whisker plot for log10 transformed zinc with respect to distance and depth

På delplot 1, 3 og 5 samt delplot 2, 4 og 6 i figur 4.9 ses aftagende koncentration med stigende afstand for såvel det øverste jordlag som for de nederste. Dog er afstandsafhængigheden tydeligst i de øverste jordlag (delplot 1, 3, og 5). For de tre afstandsintervaller, dvs. delplot 1 og 2, delplot 3 og 4 samt delplot 5 og 6 ses, at koncentrationen for alle tre afstande er lavere i de nederste jordlag.

Benzo(a)pyren

Figur 4.10 Box Whisker-plot for log<sub>10</sub>(Benzo(a)pyren) betinget af afstand og dybde

Figur 4.10 Box Whisker-plot for log10(Benzo(a)pyren) betinget af afstand og dybde
Box Whisker plot for log10log transformed BaP with respect to distance and depth

For benzo(a)pyren ses ingen umiddelbar tendenser, se figur 4.10.

PAH

Figur 4.11 Box Whisker-plot for log<sub>10</sub>(PAH) betinget af afstand og dybde

Figur 4.11 Box Whisker-plot for log10(PAH) betinget af afstand og dybde
Box Whisker plot for log10transformed PAH with respect to distance and depth

For PAH ses ingen umiddelbar tendenser, se figur 4.11.

4.3 Principal Komponent analyse (pca)

Principal Komponent Analyse - PCA er en metode til at reducere dimensionen af et flerdimensionalt datasæt og derved få mulighed for at afsløre strukturer i det oprindelige datasæt samt beskrive disse med færre variabler, dvs. som linearkombinationer af de oprindelige variabler.

Baseret på figur 4.3 og korrelationen imellem de enkelte variabler i tabel 4.3 udføres en PCA på henholdsvis bly, chrom, kobber og zink.

I dette 4-dimensionale datasæt findes følgende 4 principale komponenter:

  Komp. 1 Komp. 2 Komp. 3 Komp. 4
Std. afvigelse 1,7 0,95 0,485 0,28
Relativ andel af varians 0,7 0,22 0,059 0,02
Kumulativ andel af varians 0,7 0,92 0,98 1,00

Tabel 4.4 Betydning af de fire komponenter for beskrivelsen af varians
Importance of components for the description of variance

Det ses, at komponent nr. 1 beskriver 70% af den samlede variation og komponent nr. 2 22%. Disse komponenter er beskrevet ved linearkombinationer af de oprindelige variabler, jf. tabel 4.5.

  Komp. 1 Komp. 2 Komp. 3 Komp. 4
log10 bly 0,533 0,292 -0,717 0,341
log10 chrom 0,265 0,943 -0,200  
log10 kobber 0,561   0,658 -0,503
log10 zink 0,575 0,160 0,115 0,794

Tabel 4.5 Vægtning af de fire komponenter
Loading of the four components

Dette betyder, at komponent nr. 1 beskriver forhold, hvor de 4 variabler er ens, dog har chrom ikke så stor vægt. Komponent nr. 2 beskriver forhold, hvor krom adskiller sig fra bly og zink.

Baseret på tabel 4.4 og 4.5 vil komponent nr. 1 kunne beskrive niveauet af bly, kobber og zink. Ved at beskrive komponent nr.1's afhængighed af afstand og dybde opnås en beskrivelse af, hvordan niveauet af de tre forureningskomponenter afhænger af afstand og dybde.

Tabel 4.5 samt figur 4.2 indikerer yderligere, at bly, kobber og zink stammer fra samme kilde og spredes ens. Chrom og nikkel stammer formodentlig fra andre kilder.

Figur 4.12 Box Whisker-plot for komp.1 betinget på afstand og dybde

Figur 4.12 Box Whisker-plot for komp.1 betinget på afstand og dybde
Box Whisker plot for component1. with respect to distance and depth

På delplot 1, 3 og 5 samt delplot 2, 4 og 6 i figur 4.12 ses aftagende værdier med stigende afstand for såvel det øverste jordlag som for de nederste jordlag. De aftagende værdier med afstanden er dog tydeligst i det øverste jordlag (delplot 1, 3, og 5). For de tre afstandsintervaller, dvs. delplot 1 og 2, delplot 3 og 4 samt delplot 5 og 6 ses, at værdierne for alle tre afstande er lavere i det nederste jordlag.

Det bemærkes, at afvigende værdier (outliers) i de originale datavariabler genfindes i de principale komponenter i delplot 3, 4 og 5.

4.4 Lokal regression med principale komponenter

I det følgende er der foretaget lokal regression med de principale komponenter samt benzo(a)pyren og PAH som afhængige variabler og dybde samt afstand som forklarende variabler. Analysen er udført i de tre områder beskrevet i figur 4.1.

Betydning af afstand for små dybder

Figur 4.13 Lokal regression for de 4 principale komponenter med afstand som forklarende variabel

Figur 4.13 Lokal regression for de 4 principale komponenter med afstand som forklarende variabel
Local regression for the four principal components as a function of distance

Figur 4.14 Lokal regression for BaP og PAH med afstande som forklarende variabel

Figur 4.14 Lokal regression for BaP og PAH med afstande som forklarende variabel
Local regression for BaP and PAH as a function of distance

Figur 4.13 og 4.14 viser lokal regression for jordprøver udtaget i 0 - 0,1 m's dybde og i en afstand af 0 - 100 m fra vejen. For komp. 1 ses faldende koncentrationer fra 0 - 15 m fra vejen.

Betydning af dybde ved små afstande

Figur 4.15 Lokal regression for de 4 principale komponenter med afstand som forklarende variabel

Figur 4.15 Lokal regression for de 4 principale komponenter med afstand som forklarende variabel
Local regression for the four principal components as a function of distance

Figur 4.16 Lokal regression for de 4 principale komponenter med dybde som forklarende variabel

Figur 4.16 Lokal regression for de 4 principale komponenter med dybde som forklarende variabel
Local regression for the four principal components as a function of depth

Figur 4.17 Lokal regression for BaP og PAH med dybde som forklarende variabel

Figur 4.17 Lokal regression for BaP og PAH med dybde som forklarende variabel
Local regression for BaP and PAH as a function of depth

Figur 4.15 -4.17 viser lokal regression for jordprøver udtaget i 0 - 0,3 m's dybder og i en afstand fra 0 - 30 m fra vejen. For komp. 1 ses faldende koncentrationer fra 0 - 15 m fra vejen, men ingen tendens i dybder fra 0-0,3 m.

Betydning af moderate dybder og afstande

Figur 4.18 Lokal regression for de 4 principale komponenter med afstand som forklarende variabel

Figur 4.18 Lokal regression for de 4 principale komponenter med afstand som forklarende variabel
Local regression for the four principal components as a function of distance

Figur 4.19 Lokal regression for BaP og PAH med afstand som forklarende variabel

Figur 4.19 Lokal regression for BaP og PAH med afstand som forklarende variabel
Local regression for BaP and PAH as a function of distance

Figur 4.20 Lokal regression for de 4 principale komponenter med dybde som forklarende variabel

Figur 4.20 Lokal regression for de 4 principale komponenter med dybde som forklarende variabel
Local regression for the four principal components as a function of depth

Figur 4.21 Lokal regression for BaP og PAH med dybde som forklarende variabel

Figur 4.21 Lokal regression for BaP og PAH med dybde som forklarende variabel
Local regression for BaP and PAH as a function of depth

Figur 4.18- 4.21 viser lokal regression for jordprøver udtaget i 0 - 0,55 m's dybde og i en afstand af 0 - 60 m fra vejen. For komp. 1 ses faldende koncentrationer fra 0 - 15 m fra vejen, men tvivlsom tendens i dybder fra 0 - 0,55 m.

På grundlag af de fittede lokale regressioner vælges det, at foretage yderligere lokal regression med komp. 1 med afstande mindre end 30m og dybder mindre end 0,3 m som forklarende variabler, jf. figur 4.22. Der foretages ikke yderligere regressioner med benzo(a)pyren og PAH, idet begge variabler viser et fald i koncentrationen fra omkring 10 m afstanden fra vejen til omkring 30 m, hvor niveauet er konstant, jf. figur 4.14 og 4.19. Desuden ses, at koncentrationen efter et fald omkring 5 m igen stiger i en afstand på 10 m. Variationen er så stor, at den ikke umiddelbart kan ses afhængighed af dybden, jf. figur 4.17 og 4.21.

Figur 4.22 Lokal regression af de 4 principale komponenter med afstand som forklarende variable

Figur 4.22 Lokal regression af de 4 principale komponenter med afstand som forklarende variable
Local regression for the four principal components as a function of distance

Figur 4.23 viser den fittede lokale regressionsmodel plottet mod de beregnede værdier af komponent 1. Figur 4.24 viser residualplottet for modellen.

Figur 4.23 Fittet lokal regression af komp. 1 med afstand og dybde som forklarende variabler mod de beregnede værdier for komp 1.

Figur 4.23 Fittet lokal regression af komp. 1 med afstand og dybde som forklarende variabler mod de beregnede værdier for komp 1.
Fitted local regression for component 1 as a function of distance and depth plotted against the calculated values for comp. 1

Figur 4.24 Residualplot for den fittede model

Figur 4.24 Residualplot for den fittede model
Residual plot for the fitted model

4.5 Konklusion

På basis af nærværende analyse kan konkluderes følgende:

  • Benzo(a)pyren og PAH er i praksis 100% korrelerede (R2=0.98)

    Log(PAH)=0,716+0,978[(Log(benzo(a)pyren)]

  • Bly, kobber og zink er indbydes korrelerede
  • Chrom og nikkel er ikke korrelerede med hinanden eller andre parametre
  • Bly og BaP/PAH udviser tvivlsom korrelation
  • BaP/PAH afhængighed af afstand og dybde kan ikke påvises, da der ses store variationer i værdier og skæv fordeling
  • Bly, kobber og zink udviser "samme" koncentrationsafhængighed med hensyn til afstand og dybde.
  • Chrom- og nikkelkoncentrationen afhænger hverken af afstand eller dybde.
  • De to første principale komponenter for bly, chrom, kobber og zink beskriver 92% af variationen inden for de fire variabler. Den første komponent - komp. 1 (70%) omfatter de fire stoffer ligestillet, dog har chrom ikke så stor vægtning. Den anden komponent - komp. 2 (22%) omfatter hvordan chrom adskiller sig fra de øvrige parametre.
  • For prøver udtaget i 0 - 0,3 m dybde ses for komp.1 et faldende koncentrationsniveau fra 0 - 15 m afstand fra vejkanten.

 



Version 1.0 April 2004, © Miljøstyrelsen.