Diffus jordforurening og industri

2 Undersøgelsesstrategi og metode for nedfaldsmodel

I det følgende beskrives undersøgelsesstrategien for diffus jordforurening fra industri (nedfaldsmodel) omkring et tidligere valseværk på Amager

2.1 Systematiske trin ved opbygning af strategien

Undersøgelsesstrategien omfatter følgende trin, jf. /3/:

  • Udarbejdelse af den historiske redegørelse, dvs. inddragelse af eksisterende viden om området.
  • Opstilling af en eller flere forureningsmodeller for diffus jordforurening i området.
  • Geografisk afgrænsning af det areal, der skal undersøges.
  • Opstilling af hypoteser.
  • Valg af passende analyseparametre og måleteknikker.
  • Design af forsøgsplan, herunder hvilke data, der er nødvendige for at kunne acceptere eller afvise de definerede hypoteser.
  • Opstilling af prøvetagnings- og analyseplan.

Undersøgelsesstrategien er illustreret i figur 2.1.

2.2 Historisk redegørelse

NKT’s tidligere valseværket på Amager har været i drift fra 1908 – 1979 og beliggenhed er vist på figur 2.2.

Der er indsamlet oplysninger om potentielle forurenende aktiviteter i testarealet, herunder både punktkilder og diffuse kilder. Oplysninger om punktkilder, tidligere industrigrunde og områder med fyld- og lossepladser er indhentet fra Købehavns kommunes Miljøkontrol /4, 5, 6, 7/. På testarealet findes flere arealer med tidligere eller nuværende industri, blandt andet langs Amager Strandvejen, dvs. nord, nordøst og øst for NKT /4/. Ligeledes fandtes før i tiden flere opfyldte arealer/lossepladser på testarealet /6/. Disse er indtegnet på figur 2.2 og 2.3.

Boligområdet vest for NKT (Engvej, Øresundvej, Backersvej, Italiensvej)

og syd for NKT (Italiensvej, Kastrupvej) er etableret hovedsagelig i 1920-40’erne. Typiske findes huse af mursten med tegltag. I 2000 har Københavns Miljøkontrollen udført en undersøgelse af diffus jordforurening i boligområdet /17/. Boligbebyggelsen nordvest for NKT (Sundparken) er etableret i 1940.

Amagerbanen har været i drift som godsbane fra 1907 til 1974. I perioden 1907 til 1948 blev banen tillige anvendt til personbefordring. I driftsperiodens start anvendtes damplokomotiver som i 1920'erne blev erstattet af diesellokomotiver /8/. Amagerbanens tracé er vist på figur 2.3.

Klik her for at se Figur 2.1

Figur 2.1 Systematiske trin i undersøgelsesstrategien
Systematic steps for the investigation strategy

I 2002 er der påbegyndt anlægsarbejde som forberedelse for den kommende Metro. I denne forbindelse er der gennemførte en række undersøgelser til karakterisering af overflade jord som skal afgraves og håndteres /9/.

En mere detaljeret redegørelse for den historiske redegørelse og en OML – beregning af spredning af emissioner fra NKT-grunden er angivet i bilag A.

Figur 2.2 Oversigtskort over den fysiske placering af testarealet i København

Figur 2.2 Oversigtskort over den fysiske placering af testarealet i København
Overview showing the location of the test area in Copenhagen

2.3 Forureningsmodeller

Den diffuse jordforurening omkring NKT-grunden forventes at kunne beskrives med

  • en nedfaldsmodel, dvs. nedfald fra de tidligere skorstene på NKT-grunden

eller

  • evt. en bidragsmodel, dvs. de små tilfældige bidrag under anvendelse til boligformål i over 70 år.

Nedfaldsmodel

Det antages, at forureningsparametrene er kobber, andre tungmetaller, aluminium, PAH, phthalater, PCB og dioxiner. Det antages, at forureningsbelastningen i de terrænnære jordlag aftager med afstanden fra forureningskilden, og at det forureningspåvirkede areal strækker sig mindst 500 m i alle retninger fra forureningskilden. Det antages, at området umiddelbart østnordøst for NKT-grunden nedstrøms for dem fremherskende vindretning, jf. bilag A, er mere belastet end andre områder. Det antages, at jordforureningen aftager i dybden.

Bidragsmodel

Det antages, at jorden er belastet fra mange små bidrag gennem årene, og at forureningsniveauerne her er større end for ubenyttede arealer udenfor byerne. Det antages, at forureningsparametrene er tungmetaller, PAH, dioxiner, PCB og olie. Det antages endvidere, at forureningen udgør en varierende og tilfældig belastning i topjorden og at forurening aftager med dybden.

Området kan desuden være påvirkede af belastningen fra trafikken (liniemodellen) på de større veje.

Således antages det, at jorden omkring NKT er mere forurenet end baggrundsniveauet i landområder.

Baggrundsniveauer

Litteraturværdier for baggrundsniveauer i landområder er angivet i tabel 2.1, 2.2 og 2.3.

  Landområder
Sandjorde Lerjorde Alle jorde
As 2,6 4,1 3,3
Pb 10,5 12,1 11,3
Cd 0,13 0,22 0,16
Cr 6,4 17,1 9,9
Cu 5,6 9,0 7,0
Hg 0,03 0,06 0,04
Zn 18,4 43,3 26,8
Ni 2,9 9,6 5,0

Tabel 2.1 Medianværdier for tungmetalkoncentrationer i danske landområder /10, 11/ (mg/kg TS).
Median values for heavy metals in Danish rural soils (mg/kg dw)

  Landområder
PAH (sum af 7 PAH) 0,06- 0,6
Benzo(a)pyren (BaP) 0,01

Tabel 2.2 Skønnede referenceniveauer for PAH i jord /1/ (mg/kg TS).
Estimated reference levels for PAH (mg/kg dw).

  Landområder Byområder
Dioxin, ng- ITE/kg TS* 0,2 – 0,9 /12/ 1-3 /14,12/
Sum af Phthalater
DEHP, µg/kg TS
20- 60 /13/
10-30 /13/
1000/skøn/
100 /skøn/
PCB, µg/kg TS 0,1 – 0,4 /13/ 10-200 /15,16/

* ITE (NATO/CCMS) betyder internationale toksicitetsækvivalenter som defineret af NATO/CCMS.

Tabel 2.3 Skønnede referenceniveauer for organiske stoffer i jord.
Estimated reference levels for organic pollutants in soils

2.4 Afgrænsning af testarealet

Testarealet er på basis af den tidligere undersøgelse /17/ og den historiske redegørelse, jf. bilag A afgrænset af Holmsbladsgade, Kastrupvej, Cypernsvej, Samosvej, Kirsten Kimers vej og Amager Strandvej. Testarealet udgør i alt ca. 2,4 km², jf. figur 2.3.

På testarealet findes områder med tidligere industri og opfyldte arealer/lossepladser og der kan have været baggårdsindustri på en del af grunde.

Figur 2.3 Oversigtskort over beliggenhed af industrier og tidligere lossepladser på testarealet

Figur 2.3 Oversigtskort over beliggenhed af industrier og tidligere lossepladser på testarealet
Overview showing the location of industries and dumpsites within the test area

2.5 Opstilling af hypoteser

Der er opstillet følgende hypoteser om relationer mellem den diffuse jordforurening og forureningskilden.

Hypoteser om undersøgelsesstrategier:

  1. Undersøgelsesstrategien (en statistisk sammenligning af prøvetagningsfelter og en visualisering af forureningsniveauerne over arealet) er en effektiv metode til at sikre et datagrundlag for kortlægning på Vidensniveau 2, dvs. en statistisk dokumentation for, at jordkvalitetskriterier i topjord fra delområder er overskredet.
  2. Anvendelsen af en feltteknik (røntgenfluorescens, EDXRF) forbedrer datagrundlaget for kortlægning på Vidensniveau 2.
  3. Dataindsamling baseret på den anvendte prøvetagningsplan (antal af prøvepunkter/km²) giver et tilstrækkeligt grundlag for kortlægning på vidensniveau 2.
  4. Dataindsamling baseret på den anvendte prøvetagningsplan (antal af prøvepunkter/km²) giver et tilstrækkeligt grundlag for indsats ved overskridelser af afskæringskriterierne.
  5. Dataindsamling baseret på den anvendte analyseplan (parametervalg og analysemetode) giver et tilstrækkeligt grundlag for kortlægning på Vidensniveau 2.

Hypoteser om forureningsmodellen:

  1. Diffus jordforurening kan beskrives ved en nedfaldsmodel, idet der er en sammenhæng mellem afstanden fra forureningskilden og indholdet af forureningskomponenterne i topjorden (2-10 cm). Indholdet aftager med afstanden til kilden, indtil en given afstand. Herefter vil forureningsbelastningen ikke tiltage.
  2. Diffus jordforurening kan beskrives ved en nedfaldsmodel, idet indholdet af forureningskomponenter i jordlag 0-5 cm (inkl. græstørv) i uberørt jord (jord, hvor der ikke graves f.eks. græsarealer, ikke-dyrket jord) er højere end i det dybereliggende jordlag 2-10 cm.
  3. Diffus jordforurening kan beskrives ved en nedfaldsmodel, idet indholdet af forureningskomponenter i jordlag 0-5 cm (inkl. græstørv) i jord, hvor der graves eller plantes, er på samme niveau som i det dybereliggende jordlag 2-10 cm.
  4. Diffus jordforurening kan beskrives ved en bidragsmodel, idet der i kulturlag i byområder er et statistisk højere indhold af forureningskomponenter i forhold til referenceværdier for jord fra landområder.
  5. Diffus jordforurening kan beskrives ved en bidragsmodel, idet der er et varierende og tilfældigt indhold af forureningskomponenter i kulturlag over hele arealet, dvs. der er ingen tendens til højere indhold i bestemte retninger.
  6. Forureningsniveauerne aftager med dybden i jordlaget.

Hypoteser om arealspecifikke analyseparametre:

  1. Foruden tungmetaller og PAH findes olie (totalkulbrinter), dioxiner, PCB, phthalater og pesticider som diffus jordforurening.
  2. Der er en sammenhæng mellem koncentrationerne af benzo(a)pyren (BaP), dibenz(a,h)anthracen (DiBahA) og summen af MST 7 PAH
  3. Der er en sammenhæng mellem koncentrationerne af bly og zink.
  4. Der er en sammenhæng mellem koncentrationerne af cadmium og zink.
  5. Der er en sammenhæng mellem koncentrationerne af bly og summen af MST 7 PAH.
  6. De kritiske forureningsparametre er identiske med indikatorparametre fra andre undersøgelser, nemlig BaP og bly.

2.6 Valg af analyseparametre og måleteknikker

Potentielle forureningsparametre er identificeret som arsen (As), bly (Pb), cadmium (Cd), chrom (Cr), kobber (Cu), kviksølv (Hg), nikkel (Ni), zink (Zn), PAH, olie, phthalater, PCB, pesticider og dioxiner /1/.

Som indikatorparametre er udpeget tungmetallerne Pb, Cu, og Zn samt Miljøstyrelsens 7 PAH som er målt i alle prøver. De øvrige forureningsparametre er målt i et mindre antal prøver, se analyseplan i afsnit 2.10.

Tungmetaller

Der er ønsket en vurdering af, om anvendelse af feltteknikken, EDXRF, til måling af As, Pb, Cr, Cu, Ni, og Zn er fordelagtig, hvad angår pris og effektivitet. Analyseusikkerheden er vurderet til 10 – 20 % ved EDXRF målinger for bly, kobber, nikkel og zink ved koncentrationer fra 40 - 200 mg/kg og genfindingen er omkring 70 - 150% /2/. Analyseusikkerheden og genfinding for arsen er derimod henholdsvis 48 % og 300 % ved lave koncentrationer (4 mg/kg). Analyseusikkerheden og genfinding for chrom er henholdsvis 96% og 300% ved lave koncentrationer (12 mg/kg) /2/.

As, Pb, Cd, Cr, Cu, Ni, og Zn kan måles ved en ICP-analyseteknik, som typisk har en analyseusikkerhed på mindre end 15%. Hg kan måles ved en cold vapor teknik.

Detektionsgrænser for de to teknikker er angivet i tabel 2.4.

  EDXRF
(Teknologisk Institut)
mg/kg TS
ICP
(AnalyCen)
mg/kg TS
Aluminium - 1
Arsen 20 2
Bly 5 0,9
Cadmium - 0,05
Chrom 10 0,2
Kobber 5 0,5
Kviksølv - 0,03
Nikkel 5 0,6
Zink 5 0,5

Tabel 2.4 Detektionsgrænser ved analyse af tungmetaller
Detection limits for the analysis of heavy metals

PAH

For analyse af Miljøstyrelsens 7 PAH (fluoranthen, benzo(b)fluoranthen, benzo(j)fluoranthen, benzo(k)fluoranthen, benzo(a)pyren, dibenz(ah)anthracen and indeno(123-cd)pyren) kan der anvendes Miljøstyrelsens standardmetode, en GC-MS-SIM-teknik (jordprøven ekstraheres med toluen på rysteapparat i 16 timer). Analyseusikkerheden er angivet som mindre end 20%.

En række prøver ønskes analyseret for et udvidet antal PAH (27) samt 4 grupper af alkylerede PAH (C3 –phenanthrener, C4 –phenanthrener, C2 –dibenzothiophener og C3 –dibenzothiophener). Formålet er at vurdere PAH-sammensætningen i diffus jordforurening i forhold til PAH-kilden. Resultaterne skal desuden indgå i Miljøstyrelsens projekt om baggrundsniveauer for PAH i jord.

I /20/ er der indsamlet litteratur vedrørende PAH-sammensætning i forhold til PAH-kilder. Der er peget på visse PAH-forbindelser og indikatorer, som kan benyttes til vurdering af kilden. Bl.a. nævnes det, at methylerede PAH stammer fra olieprodukter, at reten (7-isopropyl-1-methyl-phenanthren) er en specifik indikator for afbrænding af nåletræ, og at coronen, anthanthren og benzo(ghi)perylen dannes i forbrændingsmotorer. Der er anvendt følgende fire indikatorer:

• Alkylphenanthrener/Phenanthren
   (Alkylphen/Phen)
Høj ved emission fra trafik
• Benzo(ghi)perylen/Benzo(a)pyren
   (BghiP/BaP)
Høj ved emission fra trafik
• Coronen/Benzo(a)pyren
   (Coronen/BaP)
Høj ved emission fra trafik
• Reten/Dibenz(ah)anthracen
   (Reten/DiBahA)
Høj ved forbrænding af nåletræ

Den udvidede analyse for PAH kan udføres ved en GC-MS-SIM teknik (jordprøven ekstraheres med acetone/pentan ved behandling på ultralydsbad i 5 min. og rysteapparat i 2 timer). Analyseusikkerheden er angivet som mindre end 15%.

Detektionsgrænserne er vist i tabel 2.5.

  GC-MS-SIM
(AnalyCen)
mg/kg TS
GC-MS-SIM
(Eurofins)
mg/kg TS
enkelt PAH 0,005 0,001-0,005

Tabel 2.5 Detektionsgrænser for organiske parametre
Detection limits for the analysis of organics

Olie

For analyse af benzen, toluen, ethylbenzen, xylener og totalkulbrinter er anvendt Miljøstyrelsens standardmetode ved GC-FID (jordprøven ekstraheres med pentan efter ekstraktion på rysteapparat i 16 timer). Analyseusikkerheden er angivet som mindre end 20%. Detektionsgrænserne er vist i tabel 2.6.

  GC-FID
(AnalyCen)
mg/kg TS
BTEX 0,1
C6-C10 5
C11-C25 10
C26-C35 25
C36-C45 25

Tabel 2.6 Detektionsgrænser for organiske parametre
Detection limits for the analysis of organics

PCB og Phthalater

Indholdet af PCB og phthalater er målt ved en GC-MS-SIM teknik (jordprøven ekstraheres med acetone/pentan ved behandling på ultralydsbad i 5 min og rysteapparat i 2 timer). Analyseusikkerheden er angivet som mindre end 15%. Detektionsgrænserne er vist i tabel 2.7.

  GC-MS
(Eurofins)
µg/kg TS
Phthalater 25-50
PCB 5

Tabel 2.7 Detektionsgrænser for organiske parametre
Detection limits for the analysis of organics

Dioxiner

Indholdet af dioxiner (polychlorerede dibenzofurans og dibenzodioxins) er målt ved GC/MS –SIM teknik. Detektionsgrænser er vist i tabel 2.8.

  GC-MS
ng /kg TS
Dioxiner 1-10

Tabel 2.8 Detektionsgrænser for dioxiner
Detection limits for the analysis of dioxins

Pesticider

Pesticider (Atrazin, DDT +DDE +DDD, Dichlobenil, Dieldrin, Lindan, Malathion, Parathion, Simazin) er målt ved GC-MS-SIM. Analyseusikkerheden er mindre end 15%. Detektionsgrænser er vist i tabel 2.9.

  GC-MS
(Eurofins)
µg/kg TS
Pesticider 5

Tabel 2.9 Detektionsgrænser for organiske parametre
Detection limits for the analysis of organics

2.7 Design af forsøgsplan

Nedfaldsmodellen forudsætter, at forureningsniveauet i prøvetagningspunkterne i testarealet er relateret til afstand til NKT-grunden, idet top jorden vil have været belastet med nedfald fra NKT i ca. 60 år. Der antages, at der vil forekomme en vis variation på grund af lokale arealanvendelser, jordudskiftning m.v.

Bidragsmodel forudsætter, at forureningsniveau i prøvetagningspunkter i testarealet er sammenlignelige, idet der i de boligområder med parcelhuse fra omkring 1920 -1930 er tale om den samme forureningsbelastning fra bygningsmateriale, opvarmning m.v. Der antages at der vil forekomme en vis variation på grund af lokale arealanvendelser, jordudskiftning m.v.

Punktprøverne skal være repræsentative for det generelle forureningsniveau i fladen, og give et objektivt grundlag for beskrivelse af forureningsniveauet i ethvert vilkårligt punkt i fladen. Hertil er geostatistiske analyser velegnede.

Til dokumentation af forureningsniveauet udtages derfor en række prøver fra prøvetagningsfelter tilfældigt fordelt over testarealet. Det sikres, at disse placeres med forskellig indbyrdes afstand inden for området, jf. figur 2.4. I prøvetagningsfelter af ca. 100 m² udtages jordprøver fra 1-5 punkter inden for prøvetagningsfeltet, jf. figur 2.4. For at bestemme variationerne i dybden udtages der prøver i forskellige dybder, som følger:

0 - 5 cm Jordoverfladen inkl. græstørv
2 - 10 cm Jordlag under græstørv, som typisk antages at være repræsentative ved vurdering af risiko for hudkontakt.
20 - 30 cm Repræsenterer anvendelsesdybden
45 - 55 cm Repræsenterer anvendelsesdybden
95 - 105 cm    Til afgrænsning af forurening

Dog udtages flest prøver i 2 - 10 cm’s dybde, dvs. jordlaget, hvor risikoen for eksponering er højst. I resultatoversigten benævnes prøverne i forhold til dybden, f.eks.:

  • 0,05 m’s dybde
  • 0,1 m’s dybde
  • 0,3 m’s dybde
  • 0,55 m’s dybde
  • 1,05 m’s dybde

Afstanden mellem prøvetagningspunkterne i et prøvetagningsfelt er altid mellem 1 - 10 m. Prøvetagningsfelterne placeres i forskellige afstande fra hinanden fra 30 – 500 m.

Formålet er at bestemme variationen for koncentrationsangivelserne over testarealet. I forbindelse med den geostatistiske analyse sammenlignes data parvis i forskellige afstandsintervaller, f.eks. 0 - 10 m, 10 - 50 m, 50 - 100 m, 100 - 200 m, jf. figur 2.4, hvorved det undersøges, om observationer med lille indbyrdes afstand er mere ensartede end observationer med større fysisk afstand. Den geostatistiske analyse belyser forureningens rumlige fordeling (her i 2 dimensioner) over testarealet, dvs. at den estimerer koncentrationsniveauerne, samt om der tendens til henholdsvis faldende eller stigende koncentrationer i bestemte retninger. Yderligere, og måske vigtigst, estimeres usikkerheden på estimatet af forureningsniveauet i testarealet.

I alle prøver måles indikatorparametre og der udvælges passende prøver til analyse for de øvrige parametre. Den detaljerede prøvetagnings- og analyseplan udarbejdes på grundlag af besigtigelsen og retningslinierne i forsøgsplanen.

Figur 2.4 Skitse over placering af prøvetagningsfelter i et testareal

Figur 2.4 Skitse over placering af prøvetagningsfelter i et testareal
Sketch showing pair wise comparison of sampling points in sampling squares

Inddragelse af data fra tidligere undersøgelse

Ved den tidligere undersøgelse /17/ er der udtaget 166 prøver i 0,1 m’s dybde samt på udvalgte grunde endvidere 53 prøver i 0,5 m’s dybde. Prøverne er udtaget som et sammenstik af 5 enkeltprøver indenfor et område på ca. 1 m². Prøverne er hovedsagelig udtaget i bede. Der er analyseret for tungmetallerne; Bly, cadmium, chrom, kobber, nikkel og zink med en ICP-teknik (induktiv koblet plasma), MST- 7 PAH ved GC – MS og total kulbrinter ved GC-FID.

Prøverne er udtaget i et boligområde afgrænset af NKT-grunden, Italiensvej, Backers vej og Øresundsvej, dvs. i en afstand på op til 500 m fra NKT-grunden. I dette område udtages kun nogle få supplerende prøver med henblik på kontrol af forureningsniveauet.

Vurdering af afstandsforhold

De tidligere data suppleres med flere prøver fra prøvetagningsfelter i forskellige afstande og retninger fra NKT-grunden. De yderste felter placeres i ca. 1 km’s afstand.

Vurdering af dybdemæssige forhold

Jordprøverne udtages i forskellige dybder fra overfladen (0-2 cm) og ned til 1 m’s dybde, dog hovedsagelig i 0,1 m’s dybden.

Vurdering af prøvetagningstæthed og fordel/ulemper med blandingsprøver

Der udtages prøver fra 1 til 5 punkter fra prøvetagningsfelter på 10 x10 m.

Prøverne udtages som stikprøver, idet den indbyrdes variation mellem prøver, udtaget tæt på hinanden (1-10 m) samt med større afstand (20-500 m), anvendes i databehandlingen til at vurdere om prøver fra forskellige områder er forskellige fra hinanden.

Gennemsnittet for prøverne udtaget fra den samme felt svarer til resultatet for en blandingsprøve, men spredning kendes og konsekvenser ved brug af blandingsprøver kan vurderes.

Vurdering af indikatorparametre og forureningssammensætning

Forureningsniveauet i et prøvetagningsfelt på 10 x 10 m antages at være sammenligneligt (på samme niveau). Derfor undersøges udvalgte prøvetagningsfelter intensivt, mens andre felter kan screenes ved et mindre antal prøvetagningspunkter.

Vurdering af dæklags betydning

I nogle få felter udtages 3 prøver fra bede og 3 prøver fra græsplæne og resultaterne sammenlignes.

Konceptet for prøvetagning er illustreret i figur 2.5. Prøvetagningsfelter placeres i forskellige afstande og retninger til kilden. Afstanden karakteriseres i henhold til fem zoner, A-E, således at data kan sorteres og behandles.

Zone Afstand fra NKT
A Indenfor skellet
B 0 - 50 m
C 50 - 150 m
D 150 - 500 m
E 500 - 1000 m

Klik her for at se Figur 2.5

Figur 2.5 Skitse over prøvetagningsfelter
Sketch over position for sampling areas

2.8 Prøvetagningsplan

Besigtigelse

På grundlag af kortmaterialet, det historiske materiale og forsøgsplanen er der udarbejdet et forslag til prøvetagningspositioner, jf. figur 2.5 og bilag A.

Positionerne er placeret med henblik på at undgå forurenende punktkilder samt områder, hvor den oprindelige jord kan forventes at være bortkørt. Herefter er der foretaget en besigtigelse, og positionerne er justeret i henhold til observationer og adgangsforhold. I industriområder nord, nordvest og vest af NKT-grunden har det vist sig at være problematisk at finde egnede prøvetagningspunkter, dvs. jord uden befæstelser og uden industrianvendelse jf. figur 2.3.

Antal af prøvetagningspunkter

I tabel 2.10 gives en oversigt over prøvetagningsfelter og antal af jordprøver.

Prøvetagning i dybden A B C D E
Afstand til NKT-grunden
Inden for
skellet
0-50 m 50-150 m 150- 500 m 500-1000 m
0-5 cm’s
dybde
(inklusive
græstørv)
1 felt
(3 prøver)
2 felter i uberørt jord
(6 prøver)
4 felter i bede
(8 prøver)
  2 felter i uberørt jord
(7 prøver)
2 felter i bede
(7 prøver)
4 felt
(4 prøver)
2-10 cm’s
dybde
1 felt
(3 prøver)
8 felter
(24 prøver)
17 felter
1 – 3 prøver/felt
(28 prøver)
28 felter
1 – 3 prøver/felt
(47 prøver)
47 felter
1 - 3 prøver/felt
(58 prøver)
20-30 cm’s
dybde
  4 felter
(7 prøver)
  6 felter
(8 prøver)
6 felt
(6 prøver)
45-55 cm’s
dybde
  4 felter
(6 prøver)
  4 felter
(5 prøver)
 
95-105 cm’s
dybde
  3 felter
(3 prøver)
  2 felter
(3 prøver)
 
Antal af
håndboringer
3 24 28 47 58
Antal af
jordprøver
6 54 28 77 68
Areal, km² 0,07 0,07 0,2 1,3 3,6
Ca. antal
pkt./km
42 342 140 36 16

Tabel 2.10 Prøvetagningsplan for testarealet
Sampling plan for test area

2.9 Prøvetagningsarbejde

Et feltteam bestående af to personer har udført borearbejde, prøvetagning, feltobservationer, indmåling og feltdokumentation.

Jordprøverne er tilstræbt udtaget i jord, hvor der ikke jævnligt fortages jordarbejder, f.eks. i græsplæner, men ikke i bede.

Prøvetagningen i hver felt er dokumenteret på et feltkort og observationer er noteret i en standard feltjournal med:

  • lokalitetsnavn
  • dato
  • initialer på feltfolk
  • skitse af prøveudtagningsstedet med felt- og boringsnr.
  • indmåling af UTM koordinator i forhold til referencepunkt (hvis GPS-måling umulig)
  • prøvetagningsfelternes indbyrdes beliggenhed
  • antal boringer/felt
  • antal prøver/boring
  • dybde for prøveudtagningen

Herudover er der noteret observationer vedrørende:

  • afstande til trafik (tilladt hastighed)
  • vejkryds
  • busstoppested
  • jernbaner
  • belægninger som asfalt, jernbanesveller, grus, bede, krat

Endelig er disse aktiviteter noteret:

  • beboelse
  • legepladser
  • dyrehold
  • ildsteder
  • afledning af tagvand
  • oplysninger om tidligere forhold på lokaliteten

Herudover er der i feltjournalen udført en geologisk beskrivelse af den opborede jord.

Jordprøverne er udtaget med et håndbor ved at jorden fjernes indtil toppen af den ønskede jordprofil, hvorefter håndboret renses for jorden. Der er herefter udtaget en 10 cm jordprofil som én jordprøve. Brug af et karteringsspyd ville sandsynligvis give et mere præcist geologisk profil, men prøvetagningsmængden ville være alt for lille i forhold til analysebehovet. Endvidere kan man ved brug af håndbor fornemme fremmede genstande, mens der med et kvarteringsspyd er en risiko for at banke spyddet igennem ledninger m.v. hvis disse ikke er meget præcist angivet på ledningsplanerne.

Prøvetagningspunkter er indmålt ved en GPS-5700 med en nøjagtighed på 10 mm vandret og 20 mm lodret. Koordinator er angivet i system 34 Sjælland og terrænkote i DNN. GPS-målingerne er fortaget i forhold til signal fra ca. 6 – 8 satellitter. Signalet er dog svagt på visse tidspunkter om dagen. Disse tidspunkter kan i forvejen aflæses i en web-almanak /21/. Der kan desuden være forstyrrelser ved målinger tæt på høje bygninger eller under høje træer. Det anbefales derfor, at indmåle enkelte referencepunkter med GPS, så baggrundskort og indmålte boringer kan vurderes i forhold til hinanden. GPS- målingerne bør i øvrigt foretages i det koordinatsystem, som grundkortet findes i, da omregninger mellem de forskellige koordinatsystemer vil øge usikkerheden.

Hver jordprøve har fået et entydig prøvenr. bestående af lokalitetens ID-Zone, ID-felt nr.-boringsnr. og en dybdeangivelse. Alle jordprøver er udtaget i rilsanposer, lagt i køletasker og transporteret til miljølaboratoriet (NIRAS), hvor der er målt PID og foretaget en geologisk beskrivelse. Der er udtaget delprøver til de forskellige analyser. Prøveemballage er fremsendt af analyselaboratorierne og bestod af redcap-glas til olie- og PAH-analyse iht. Miljøstyrelsens standardmetoder, teflonkopper til EDXRF-analyse, plastposer til tungmetalanalyse med ICP og tørstofbestemmelse samt rilsanposer til udvidet PAH-, PCB-, phthalat-, pesticid- og dioxinanalyser.

2.10 Analysearbejde

PID, pH, tørstofindhold og organisk indhold

For alle jordprøver er jordarten beskrevet og der er målt tørstofindhold, glødetab og PID-udslag (udslag målt med en Photoionisation-detektor, der giver udslag ved flygtige forureninger).

Tungmetaller

Alle prøver fra prøvetagningsfelterne er analyseret for As, Pb, Cr, Cu, Ni og Zn (uden anden forbehandling end tørring, jf. konklusionerne i /3/) med en feltteknik (Røntgenfluorescens teknik - EDXRF) hos Teknologisk Institut i Århus.

Tungmetalindholdet er herefter kontrolleret i ca. 10 – 20% af prøverne ved en akkrediteret ICP-analyseteknik (induktivt koblet plasma) hos AnalyCen, hvor der desuden er målt for Cd og Al.

PAH

Alle jordprøver er analyseret for sum af MST 7 PAH (polycycliske aromatiske hydrocarboner) ved Miljøstyrelsens standardmetode med en GC-MS-SIM teknik (gaschromatografi med masse spektrometri og selektiv ion monitoring) hos AnalyCen.

Til vurdering af PAH-sammensætningen er en række prøver (ca. 20% af prøverne i 2-10 cm’s dybde) analyseret for et udvidet antal af PAH (27) samt 4 grupper af alkylerede PAH (C3 –phenanthrener, C4 –phenanthrener, C2 –dibenzothiophener og C3 –dibenzothiophener). Analysen er udført hos Eurofins ved en GC-MS-SIM-teknik

Olie

En række prøver (ca. 10% af prøverne udtaget i 2-10 cm’s dybde) er analyseret for oliekulbrinter hos AnalyCen, og der er foretaget en vurdering af muligheden af, at prøverne har et naturligt indhold af kulbrinter, PAH m.v.

Phthalater, PCB, dioxin og pesticider

Ca. 3 - 10% af prøverne er analyseret for phthalater (dimethylphthalat, diethylphthalat, di-n-butylphthalat, butylbenzylphthalat, DEHA, DEHP, di-iso-nonylphthalat og di-n-octylphthalat) og PCB (CB 28, CB 52, CB 101, CB 118, CB 153, CB 138, CB 180). Analyserne er udført ved GC-MS-SIM hos Eurofins (i ekstraktet fra en udvidet PAH-analyse). Desuden er ca. 3 - 5% af prøverne analyseret for dioxiner (polychlorerede dibenzofuraner og dibenzodioxiner). Denne analyse er udført ved GC-MS-SIM hos GfA Gesellschaft fûr Arbeitsplatz- und Umweltanalytik mbH, Tyskland.

Et mindre antal prøver (8 stk.) er analyseret for pesticider (Atrazin, DDT +DDE +DDD, Dichlobenil, Dieldrin, Lindan, Malathion, Parathion, Simazin) ved GC-MS-SIM hos Eurofins.

Kvalitetsmålinger

Der er udført nogle få analyser for tungmetaller, PAH og PCB på referencejord (standard). Der er ved udførelse af dobbeltbestemmelse på delprøver fra samme homogeniserede jordprøve foretaget en vurdering af analyseusikkerheden for målinger af tungmetaller med EDXRF og ICP samt for Miljøstyrelsens 7 PAH ved GC-MS-SIM.

2.11 Databehandling: Deskriptiv statistik

Den deskriptive statistik giver et overblik over forureningsniveauet for de enkelte områder som helhed, men siger ikke noget om rumlige (spatielle) tendenser (f.eks. om forureningsniveauet aftager i en vis retning), som beskrives i afsnittet om geostatistisk. Der henvises til lærebøger om statistisk for en uddybende beskrivelse på de anvendte teknikker /22/.

Resultaterne fra hvert enkelt testareal præsenteres med følgende parametre: Minimum, maksimum og gennemsnit samt koncentrationerne som repræsenterer 10%, 25%, 50% (medianværdien), 75% og 90% datafraktiler. Resultaterne afrundes til to betydende ciffer i oversigtstabellerne.

Fraktiler

Ved beregning af fraktilværdier i oversigtstabellerne returneres kun målte værdier, hvis rangordenen svarer til de ønskede fraktiler, ellers interpoleres mellem de to værdier til hver side. Beregningen for den “k`te” fraktil på “n” antal datapunkter udføres som følger:

Hvis k er et multiplum af 1/(n-1), angives en værdi for fraktilen svarende til en målt værdi, svarende til den ønskede k`te fraktil.

F.eks. vil 0,25 fraktil for 9 datapunkter svare til det tredje datapunkt, 0,375 fraktil = 4. datapunkt, 0,5 fraktil = 5. datapunkt, 0,75 fraktil = 7. datapunkt.

I modsat fald interpoleres en værdi mellem de to nærmeste værdier.

F.eks. vil 0,8 fraktil svare til en værdi mellem 7. og 8. datapunkt

Ligeledes anvendes ved beregning af en medianværdi en interpoleret værdi for datasæt med et lige antal datapunkter. Det vil sige, at et datasæt opfattes som et kontinuum. I /22/ er der redegjort for nødvendigheden af interpolation, samt beregningsprocedurer, såfremt der ikke findes en "unik" værdi. Dette er ikke problematisk, hvis der er mange datapunkter, men mindre tilfredsstillende ved få data. Derfor vises ved mindre end 7 data alene min., max., medianværdien og evt. gennemsnittet.

Desuden illustreres udvalgte analyseparametre som fraktilplot, hvor hvert datapunkt plottes som en fraktil, jf. /22/. På fraktilplottet kan der aflæses, hvilket datapunkt (X), der svarer til f.eks. 0,80 fraktil. Dette betyder, at 80% af dataene har koncentrationer svarende til eller er mindre end X. Fordelen ved et fraktilplot er, at alle datapunkter er vist, og figurens udseende herunder datafordelingen er uafhængig af koncentrationsintervaller(som f.eks. ved histogrammer).

Data under detektionsgrænser

Der er anvendt forskellige analysemetoder med forskellige detektionsgrænser, jf. tabel 2.4–2.9. Dette har dog ikke betydning, hvis resultaterne er væsentligt større end detektionsgrænserne, men er problematisk ved arsen, chrom og nikkel. Koncentrationsniveauerne for disse metaller i testarealer er typisk omkring eller under detektionsgrænsen for EDXRF-metoden, mens de ligger over detektionsgrænsen for ICP-metoden. Resultaterne for disse metaller er derfor vist særskilt for de to analysemetoder.

I /22/ angives, at hvis 15% af dataene er under detektionsgrænsen, kan der anvendes en værdi svarende til

  • den halve af detektionsgrænsen,
  • detektionsgrænsen
  • eller en passende lav værdi.

Hvis 15-50% af dataene er under detektionsgrænsen, kan der overvejes en datahåndtering, hvor der fjernes data fra begge ender af fordelingen. I så fald er der behov for en større datamængde og en symmetrisk fordeling. Såfremt 50 - 80% af dataene er under detektionsgrænsen, bør det overvejes at anvende andre parametre til beskrivelse af dataene, f.eks. 0,75 fraktil.

Af hensyn til databehandlingen skal det generelt bemærkes, at resultater under detektionsgrænsen angives med en værdi svarende til det halve af detektionsgrænsen.

Medianværdien vil være upåvirket af data under detektionsgrænsen, hvis den ligger over detektionsgrænsen, men for at undgå misvisende fraktilværdier i oversigtstabellerne, anvendes betegnelsen “i.p.” for resultater under detektionsgrænsen. Parametre med værdier under detektionsgrænserne er typisk chrom, nikkel og arsen samt enkelte PAH.

Gennemsnit

Håndtering af data under detektionsgrænsen har betydning ved beregning af gennemsnitsværdien. I oversigtstabellerne er der derfor kun vist en værdi for gennemsnittet, hvis 85% af resultaterne er over detektionsgrænsen. I modsat fald er der kun vist minimum, maksimum og medianværdien.

Datafordeling og betydning ved databehandling

Hvis et sæt prøver repræsenterer punkter fra en normalfordeling, kan resultaterne beskrives ved gennemsnittet og variansen (symmetrisk spredning af data på hver side af gennemsnittet). Et sæt prøver fra en normalfordeling vil i praksis være begrænset til en endelig størrelse og vil derfor være t-fordelt. Histogrammerne for en normalfordeling med en stor varians vil være bedre end en fordeling med en lille varians som illustreres i figur 2.6

Figur 2.6 Histogrammer for to normalfordelinger med hhv. en stor og lille varians

Figur 2.6 Histogrammer for to normalfordelinger med hhv. en stor og lille varians
Histograms showing two normal distributions with a large and a small variance

Figur 2.7 Histogrammer for lognormalfordelinger

Figur 2.7 Histogrammer for lognormalfordelinger
Histogram showing log normal distributions

Miljødata viser derimod ofte en asymmetrisk fordeling af værdier med en lang hale til højre på fordelingen (høje værdier), jf. figur 2.7. Dette betyder, at forudsætningen for mange statistiske standard tests ikke er opfyldt. Da funktionen Y=ln(X) for lognormale data er normalfordelt, kan en logaritme- transformation af værdierne betyde, at dataene bliver tilnærmelsesvis normalfordelte. En sådan transformation er nødvendigt, hvis der skal anvendes statistiske tests eller geostatistiske databehandlinger, idet disse forudsætter, at dataene er normalt fordelt, bl.a. ved beregning af gennemsnit og konfidensinterval for dette.

I alle datatabeller vises dog gennemsnittet, selv om forudsætningen om en normalfordeling ikke nødvendigvis er opfyldt. Hvis gennemsnittet og 0,5 fraktil (medianværdien) er forskellige, er der tale om en asymmetrisk fordeling - hvis der f.eks. findes høje værdier, vil gennemsnittet være højere end median.

Hvis dataene er normalfordelte (symmetriske omkring gennemsnittet), vil et fraktilplot have en S-form med en relativt flad sektion i midten. Derimod vil en stor spredning i koncentrationsniveauet betyde, at kurven stiger brat. Hvis dataene er asymmetriske med en lang hale (høje værdier) til højre ses en stejl stigning i den øverste højre del af kurven i forhold til den nederste venstre del.

Miljødata kan dog også være anderledes fordelt, og man skal være opmærksom på dette, hvis forskellige datasæt skal sammenlignes.

Udover tabellerne med deskriptiv statistik og fraktilplot er der desuden fortaget en analyse af datafordelingen. Til databehandlingen er anvendt forskellige værktøjer fra Excel og R (R er statistiske og grafiske værktøjer udviklet ved Bell Laboratories som “open source” og kan gratis downloades fra Internettet, http://www.r-project.org/). Kun resultater og særlig interessante figurer er inkluderet i rapporten.

Det er analyseret, om dataene er normalfordelte med angivelse af følgende parametre:

Skewness: Afvigelse fra symmetri omkring gennemsnit, hvor en normalfordeling har en værdi på 0. Positive værdier indikerer en lang hale til højre og negative værdier indikerer en lang hale til venstre.
Kurtosis: Længden (størrelsen) af halen, hvor en normalfordeling har en værdi på 0. En høj værdi indikerer, at fordelingen har en høj top og en lang hale i forhold til en normalfordeling, mens en negativ værdi indikerer en bred top og kortere hale i forhold til en normalfordeling.
Normal-Q-Q-plot: Data er plottet i forhold til fraktilerne i en normalfordeling. Dette svarer til at plotte data på normalfordelingspapir. Her er blot anvendt teoretiske variabler i en standard normalfordeling som x-akse frem for fraktilerne. Disse akser er lineære og kan bedre håndteres af et elektronisk medie. For en ideel normalfordelt variabel vil punkterne ligge på en ret linie. For hvert plot er angivet den bedst tilpassede linie. Ekstreme afvigende værdier eller såkaldte “outliers” kan identificeres ved deres beliggenhed langt fra denne linie. Et sample fra en normalfordeling vil i praksis være begrænset til en endelig størrelse, og vil derfor være t-fordelt og udgøre en svag s-form i plottet. En udpræget s-form betyder imidlertid, at fordelingen har længere haler end normal- eller t-fordelingen. En U-form betyder, at fordelingen er skæv i forhold til en normal- eller t-fordeling.
Shapiro-Wilk (W):    Test til at vurdere om data er normalfordelte. Testen bygger på korrelationen imellem fraktilerne i en standard normalfordeling og de rangordnede værdier i datasættet. Den er dermed direkte relateret til ovenstående Q-Q-plot. Nulhypotesen er, at den sande fordeling er en normalfordeling. Sandsynligheden (p) for det aktuelle udfald af hver test angives. Ved p< 0,05 er testen signifikant og nulhypotesen forkastes, dvs. at datafordelingen ikke er normalfordelt.

Korrelation mellem parametre

Pearsons korrelation, R, mellem de enkelte parametre indikerer, om der er et lineart forhold mellem to parametre, hvor en positiv værdi på 1 betyder et perfekt positivt lineart forhold (begge parametre vokser) og en negativ værdi på –1 betyder et perfekt negativt lineart forhold (en parametre aftager, mens den anden vokser). En værdi tæt på 0 betyder, at der ingen korrelation er mellem parametre. Pearsons korrelation forudsætter normalfordelte data.

Herudover kan der udføres regressionsanalyse, samt x-y plots med angivelse af R² (ofte benævnt forklaringsgrad), hvor R² ligeledes kan have en værdi mellem –1 og +1.

Følgende beskrivelser i tabel 2.11 er anvendt i forbindelse med databehandling:

R Beskrivelser
>0,87 >0,75 God korrelation
0,71 - 0,87 0,5 - 0,75 Rimelig korrelation
0,5 - 0,71 0,25 – 0,5 Tvivlsom korrelation*
<0,5 <0,25 Ingen korrelation*

* Der kan stadig være en sammenhæng, men denne kan ikke belyses pga. utilstrækkelig datamængde

Tabel 2.11 definition af beskrivelser ved korrelationsanalyse
Definition of description of degree of correlation

Sammenligning af datasæt

Såfremt fordelingerne ikke er normal eller lognormal anvendes en non-parametrisk test, “Wilcoxon Rank Sum Test” til at sammenligne data f.eks. fra forskellige dybder eller delområder. For normalfordelt data anvendes en t-test til at sammenligne gennemsnittet.

2.12 Databehandling: Geostatistik

Geostatistikken anvendes til at vurdere rumlige (spatielle) tendenser og til at estimere koncentrationsniveauer samt usikkerheder for estimatet over et testareal. I bilag B i datarapport om kulturlag /30/ er vedlagt en indledende beskrivelse af den matematiske teori ved geostatistisk.

Geostatistikken bygger på, at målinger på prøver, der er udtaget tæt på hinanden, er mere ens end målinger på prøver, der er udtaget med større afstand. Målingerne siges, at være “korrelerede” inden for en vis afstand. Denne afstandskorrelation betegnes i det følgende som spatiel korrelation.

Geostatistisk databehandling beregner forskel i varians mellem dataværdier, lokaliseret i forskellig afstand fra hinanden. Alle data inden for forskellige afstandsintervaller (lag), f.eks. 0-10, 10-20 m m.fl. sammenlignes parvis. Herefter laves et XY-plot af forskellen i variansen mod afstanden. Et XY-plot er vist i figur 2.8. Figuren kaldes et eksperimentalt semivariogram. Ved at vælge forskellige lagintervaller, ændres udseende af det eksperimentalt semivariogram. Det er således vigtigt at foretage følsomhedsberegninger og vælge realistiske lagintervaller i forhold til områdets størrelse og forventningen om forureningsspredningen.

Figur 2.8 Et semivariogram

Figur 2.8 Et semivariogram
A semivariogram

Der kan generes teoretiske modellinier, som “fittes” til det eksperimentelle semivariogram og som beskriver det matematiske forhold for variansen mellem datapunkterne.

Skæring af Y-aksen af den teoretiske modellinie, Co, betegnes “nugget” og er udtryk for summen af jordmediets mikrovariation og måle-/analyseusikkerhed, der vil bidrage til usikkerheden på estimatet af koncentrationen i ethvert punkt, uanset afstanden til nært beliggende målepunkter. I figur 2.8 er nuggetvarians = 0,1.

Alle datapunkter, der ligger tættere end afstanden “R”, range (som i figur 2.8 er 300 m), viser spatiel korrelation. Der siges, at data er korrelerede inden for en “range“ af 300 m, dvs. jo tættere datapunkterne ligger, jo mindre er variansen mellem punkterne. Ved afstande større end “R”, er variansen høj og tilfældig med en værdi svarende til omkring C0+ C1 - denne værdi betegnes “sill”. I figur 2.8 er sillvarians = 0,3. Data er ikke korrelerede ved afstande større end “R”, dvs. afstanden har ingen betydning for variansen mellem punkter med en afstand større end 300 m.

Prøver udtaget tættere end afstanden “R” er korrelerede. Dette indikerer, at den maksimale prøvetagningsafstand bør være mindre end R hvis der skal ekstrapoleres mellem datapunkterne, f.eks. ved kortlægning. Udover at ekstrapolere (estimere) koncentrationsniveauerne i alle vilkårlige punkter ved hjælp af kriging, kan den teoretiske model anvendes til at beregne et konfidensinterval for de estimerede værdier.

Hvis dataene alene viser “nugget” og ingen “sill” er der tale om et inhomogent medie uden spatiel korrelation. I sådanne tilfælde er det muligt at beskrive områdets data med et gennemsnit og konfidensinterval (dette forudsættes at data er normal- eller lognormalfordelte) eller med et interval, med f.eks. 5 og 95% fraktiler.

Det er således vigtigt at finde en teoretisk model, som bedst beskriver semivariogrammet og dermed giver de bedste skøn for “nugget”, “sill” og “range”. En væsentlig del af databehandlingen i den geostatistiske databehandling omhandler tilpasning af den teoretiske model samt validering og krydsvalidering af denne for at sikre, at den matematiske løsning er korrekt og troværdig.

Semivariogrammodellen kan anvendes til at forudsige (beregne) værdierne af de undersøgte parametre i vilkårlige punkter i planen. De beregningsalgoritmer, der anvendes er simpel kriging, ordinær kriging og universal kriging. De formelle i forskelle imellem disse metoder bør ikke negligeres. Simpel kriging forudsætter formelt at der er den samme forventningsværdi til den undersøgte parameter i hele det undersøgte område, hvorimod dette ikke er tilfældet for ordinær kriging. Universal kriging anvendes hvis der er en trend i variationen, der er betinget af f. eks fysiske forhold. Der er i nærværende undersøgelse udelukkende anvendt ordinær kriging. Alle tre metoder forudsætter at den parameter, der undersøges er normalfordelt

En væsentlig styrke ved krigingsmetoden er at de estimerede værdier også er normalfordelte. Der beregnes derfor såvel et estimat som en standardafvigelse for dette estimat. Standardafvigelsen vil afhænge af især nugget, modellen og afstanden til de målte punkter i planen. Nugget må opfattes som mikrovariation, og i tilfælde af kemiske parametre som det er tilfældet her, også af prøvetagnings- og analyseusikkerhed. I denne undersøgelse er standardafvigelsen og normalfordelingsegenskaben anvendt til at estimere sandsynligheden for at et en prøve udtaget et givet sted i planen er større end jordkvalitetskriteriet (JKK). Tilsvarende er der estimeret en sandsynlighed for at et en prøve udtaget et vilkårligt sted i planen er mindre end afskæringskriteriet (ASK) for det pågældende stof.

Ved at inddrage flere korrelerede parametre i en mulitivariate analyse styrkes den matematiske beskrivelse af et semivariogram, som nu kaldes et krydssemivariogram (da varians for flere parametre sammenlignes på kryds). De tilsvarende krigingsalgoritmer til at forudse de analyserede parametre kaldes henholdsvis simpel cokriging, ordinær cokriging og universal cokriging.

Cokriging giver et bedre prædiktion over (mindre varians, dvs. mindre usikkerhed) af de estimerede værdier sammenlignet med resultatet fra den tilsvarende univariate kriging og bør derfor anvendes, såfremt flere variabler samtidig undersøges /23/. Cokriging har imidlertid sin største fordel, hvor en eller flere variabler kun er målt i én fraktion af prøvetagningspunkterne. I praksis har det imidlertid vist sig vanskeligt at finde software, der kan håndtere manglende målinger, dvs. at der kun kan behandles datapunkter, hvor alle parametre er målt. Generering af krydssemivariogrammer har vist sig at være et effektivt værktøj ved modeltilpasning af det eksperimentelle semivariogram, idet flere variabler kan modelleres i en arbejdsgang. Men anvendelse af cokriging ved estimering af koncentrationsniveauer gav hyppigt numeriske problemer for det anvendte software.

Det er ikke muligt her at redegøre detaljeret og systematisk for den teoretiske og matematiske baggrund for geostatistikken, dels fordi emnet er meget omfattende og dels fordi det ligger uden for rapportens formål. Men enhver, der anvender geostatistiske analyser, må dog opfordres til at opnå et minimum af indsigt heri. Der vil dog her blive nævnt nogle af de forudsætninger, de enkelte analyser hviler på, samt introduceret begreber og termer, der er anvendt i de følgende kapitler. Det kan anbefales, at der læses anden relevant litteratur, såfremt der ønskes en nærmere introduktion til den geostatistiske databehandling /23-26/.

Kontrol af forudsætninger og fortolkninger

Det kan i praksis ofte være vanskeligt at afgøre, om den undersøgte parameter opfylder de forudsatte antagelser og betingelser for den geostatistiske analyse. Det gælder ikke mindst antagelsen om normalfordelingen.

Normalfordelingskravet kan undersøges med de metoder, der er nævnt i ovenstående afsnit om anvendte deskriptive metoder. Som det ofte er tilfældet med mange naturlige stokastiske variabler, er geokemiske data ofte lognormalfordelte. Det betyder, at det er nødvendigt at logaritme-transformere de pågældende parametre før analysen. Den estimerede koncentration og konfidensintervallet skal derfor tilbagetransformeres, før de kan anvendes ved kortlægning. Ved denne procedure introduceres en uundgåelig bias, der ses som et skævt konfidensinterval, med en forholdsvis høj øvre grænse.

På trods af logaritmisk transformering af data forekommer der på grund af ekstreme værdier i flere tilfælde afvigelser fra normalfordelingen. Afvigelser fra normalfordelingen for det samlede datamateriale kan imidlertid også ofte skyldes forhold, der knytter sig til særlige spatielle forhold i det undersøgte område, det anvendte undersøgelsesdesign eller en kombination. I sådanne tilfælde kan datafordelingen undersøges isoleret i forskellige delområder. Såfremt betingelserne for en normalfordeling er tilnærmelsesvist opfyldt i disse delområder, anses det for forsvarligt at udføre analysen på området som helhed.

Det kan ligeledes være nødvendigt med en særskilt undersøgelse af semivariogrammerne inden for forskellige delområder, idet variogrammet kan ændre karakter inden for det undersøgte område.

Validering af den spatielle korrelation, som anvist af den valgte teoretiske model, kan testes med Moran's I-test. Testen er imidlertid tidskrævende og ikke særlig følsom. Derfor anvendes oftest grafiske metoder.

Flere simple plot og grafiske afbildninger er relevante forud for konstruktionen af semivariogrammet. Der bør foretages følgende aktiviteter:

  • granske datamaterialet på kort
  • evaluere fordelingerne i forhold til normalfordelingen
  • identificere eventuelle ekstreme værdier

Scatterplot af kvadrerede differencer plottet mod afstanden mellem punktobservationer kan bidrage til et grundlæggende og simpelt billede af den spatielle korrelation, samt med informationer om den geografiske skala for variationen. Hvis der er en spatiel korrelation, må det forventes at de kvadrerede differencer vokser med afstanden imellem prøvepunkterne. Et scatterplot illustreres i figur 2.9.

Figur 2.9 Illustration af et scatterplot af afstand og kvadrerede differencer imellem logaritmisk transformerede koncentrationer i parvise prøvepunkter for Kobber.

Figur 2.9 Illustration af et scatterplot af afstand og kvadrerede differencer imellem logaritmisk transformerede koncentrationer i parvise prøvepunkter for Kobber.
Illustration of a scatter plot of distance and squared difference between log-transformed concentrations in pair wise sampling points for copper.

Ved spatiel korrelation må der forventes en positiv korrelation imellem de kvadrerede differencer og afstande inden for den korrelerede “range” for varians. En sådan korrelation kan evt. testes med Spearmans korrelationskoefficient, der er velegnet til at vurdere voksende (monotone) stokastiske funktioner. Spearmans korrelationskoefficient test er en såkaldt “fordelingsfri” rangtest.

Ved evalueringen af variogrammet er det især vigtigt at evaluere de punkter i semivariogrammet, som viser større eller mindre hop eller dyk i estimerede semivarianser, idet disse også kan påpege særlige spatielle forhold på det undersøgte område (en vej, et areal med andet forureningsmønster m.fl.). Disse afvigelser er dog kun relevante, hvis de ses indenfor den korrelerede range for varians (mindre end 300 m i figur 2.8). Større eller mindre hop eller dyk i estimerede semivarianser, der har en større “lag-afstand” end “range” kan skyldes mere tilfældige irrelevante forhold snarere end de egenskaber, der er knyttet til den spatielle variation.

Det kan være vanskeligt at vurdere, om semivariansen er en entydigt voksende funktion, især når nugget udgør en betydelig del af den totale variation, som det ofte kan være tilfældet for diffus jordforurening. Også her benyttes Spearmans korrelationskoefficient i det kritiske område fra lag=0 til lag > Range.

Endelig er det vigtigt at vurdere, hvilken indflydelse ekstreme værdier har på variogrammet. Den mest sårbare kombination er ekstreme værdier kombineret med ekstrem beliggenhed. Evt. konstrueres variogrammet både med og uden disse værdier.

Geostatistisk flowdiagram

I figur 2.9 er opstilles de forskellige trin som gennemgås i forbindelse med en geostatistisk analyse.

Klik her for at se Figur 2.9

Figur 2.9 Flowdiagram for geostatistik
Flow diagram for geostatistical analysis

Trin I: Er data normal- eller lognormalfordelte?

  • Data skal være normalfordelte (eller lognormalfordelte) for at der kan foretages estimering af koncentrationsniveauer, konfidensintervaller eller sandsynlighed for overskridelser af JKK og ASK.
     
  • Da dataene skal være normalfordelte, vil analysen være følsom over for afvigende data punkter, og for delområder, som viser stor heterogenitet, for skævhed i prøvetagningsplanen (f.eks. at der indsamles flere punkter fra et delområde med et afvigende niveau) eller over for historiske begivenheder, som har påvirket kulturlaget.
     
  • Hvis det ikke ved en dyberegående dataanalyse og opdeling i delområder iht. historik, er muligt at beskrive, hvorvidt data er normal- eller lognormalfordelte (trin 1b) bør det vurderes, om der skal udtages flere jordprøver (trin 1c).
     
  • Arealer med stor heterogenitet findes især i områder med høj udnyttelsesgrad, lang historik og mange skiftende arealanvendelser, hvor der er foretaget diverse renoveringer og jordudskiftning. Disse typer arealer kan formentlig kun kortlægges ved et større deltaljeringsniveau, eventuelt helt ned på ejendomsniveau.

Trin 2: Analyse af spatiel korrelation

  • Hvis variansen mellem punkter tæt på hinanden er af samme størrelse som mellem punkter med stor afstand, er der ingen spatiel korrelation.
     
  • Der skal være et vist antal punkter inden for hvert afstandsinterval. Forskellige parametre kan optimeres i forbindelse med analysen, f.eks. lagafstanden, men det er vigtigt, at der er et tilstrækkeligt antal datapunkter til at definere formen for det eksperimentelle semivariogram – der skal altså være et vist antal prøver. Antallet er til dels uafhængigt af arealets størrelse, men er ofte afhængigt af områdets heterogenitet.
     
  • På de ældre områder ses stor variation i koncentrationsniveauet. Dette betyder, at “nugget” – variansen inden for kort afstand tilnærmer sig værdien for “sill” – variansen mellem ukorrelerede punkter på stor afstand. Dette giver meget støj i semivariogrammet og gør det svært at validere hvilken teoretisk modelligning, der skal anvendes til at beskrive data i det eksperimentale semivariogram. Dette betyder også, at arealer uden spatiel korrelation kan vise ren “nugget” effekt, dvs. variansen mellem punkterne tæt på hinanden er samme størrelse som mellem punkter på stor afstand.
     
  • Mens værktøjet til at lave krydssemivariogrammer er meget nyttigt, idet mange parametre kan evalueres samtidigt i forbindelse med simulering af den matematiske modelformulering, har det vist sig problematisk at anvende cokriging. Ordinær kriging er anvendt til estimering af koncentrationsniveauer m.v.
     
  • Scatterplot af kvadrerede differencer plottet mod afstanden mellem punktobservationer kan bidrage til et grundlæggende og simpelt billede af den spatielle korrelation, og med information om den geografiske skala for variationen.
     
  • Hvis den spatielle korrelation ikke kan påvises, vil den indledende databehandling i forbindelse med den geostatistiske analyse (efter inddragelse af historik, følsomhedsanalyse af afvigende målinger m.v.) ofte indikere en rationel opdeling i delområder, og det kan undersøges, om data fra delområdet er normal- eller lognormalfordelte, jf. trin 1b. Ligesom i trin 1b, kan det vurderes, om der skal udtages flere jordprøver.
     
  • Hvis der ikke findes spatiel korrelation, kan alle data for et delområde behandles under ét, dvs. at der kan på baggrund af den deskriptive statistik beregnes ét gennemsnit og ét konfidensinterval for hele delområdet, jf. trin 2b.
     
  • Hvis der ikke findes spatiel korrelation kan der på basis af på grundlag af en fordelingsfunktion for normalfordeling foretage en beregning med arealets gennemsnit og standardafvigelse af sandsynligheden for, om koncentrationsniveauet for hele delområdet under ét er højere end JKK og mindre end ASK.
     
  • Logaritme-transformerede data eller ikke- transformerede data kan kun bruges, hvis de er normalfordelte. Dette kræver en omhyggelig afgrænsning af delområderne.
     
  • Ligesom i trin 1c, kan det vurderes, om der skal udtages flere jordprøver for at forbedre datagrundlag i kritiske delområder.

Trin 3: Beregning af spatiel forhold på arealet

  • Når der er opnået en matematisk beskrivelse af, hvorledes de enkelte punkter er relateret til hinanden i forhold til deres indbyrdes afstand, kan man tegne et kort med anvisning af koncentrationen og konfidensintervaller.
     
  • Sandsynligheden for overskridelse af JKK og ASK kan i ethvert punkt beregnes på grundlag af den geostatistiske analyse, dvs. semivariogram-modellens estimat af såvel koncentration som standardafvigelse.
     
  • Alle usikkerhedsbidrag vil være indeholdt i denne sandsynlighed, der grundlæggende er et udtryk for, med hvilken sandsynlighed der vil kunne måles en koncentration over eller under jordkvalitetskriteriet, hvis en prøve fra det pågældende sted blev udtaget og analyseret.

Fordelen ved beskrivelsen af det spatielle (rumlige) forhold er, at koncentrationsniveauet beskrives som et kontinuum, og at det er muligt at håndtere mindre delområder, hvor der findes større eller mindre varians. Det vil sige, at estimatet for koncentrationsniveau og konfidensinterval samt sandsynligheden for, hvorvidt jorden på et givet sted i området ligger over jordkvalitetskriteriet, er baseret på de faktiske målinger i nærheden af stedet – altså den spatielle korrelation, idet målinger tæt på hinanden vil være mere ensartede end målinger foretaget på større afstande.

 



Version 1.0 April 2004, © Miljøstyrelsen.