Diffus jordforurening og kulturlag 2 Undersøgelsesstrategi og metode for bidragsmodelI det følgende beskrives undersøgelsesstrategien for kulturlag (bidragsmodel) i de 10 testarealer samt i referenceområdet, mens der i kapitel 3 - 14 foretages en gennemgang af de indsamlede data for hver af disse lokaliteter samt af data fra tidligere områdeundersøgelser i København. 2.1 Systematiske trin ved opbygning af strategienUndersøgelsesstrategien omfatter følgende trin, jf. /3/:
Undersøgelsesstrategien er illustreret i figur 2.1. 2.2 Historisk redegørelseDer er indsamlet oplysninger om potentielle forurenende aktiviteter i de 10 testarealer, herunder både punktkilder og diffuse kilder. Oplysninger om punktkilder, tidligere industrigrunde og områder med fyld- og lossepladser er indhentet fra Købehavns kommunes Miljøkontrol /4, 5, 6/ og Vestsjællands Amt /7/. Oplysninger om den bymæssige udvikling, herunder boligkvarterer, er indsamlet fra diverse historiske litteraturkilder /8-12/ samt fra Købehavns Kommunes Miljøkontrol /13/ og Ringsted Kommune, Teknisk Forvaltning /14/. Figur 2.1 Systematiske trin i undersøgelsesstrategien 2.3 ForureningsmodelSom udgangspunkt er det antaget, at diffus jordforurening i de 10 testarealer har sin oprindelse i en bidragsmodel, hvorved små tilfældige bidrag af forurenende stoffer og materiale er tilført kulturlaget igennem århundreder. Den diffuse jordforurening forventes at udgøre en varierende og tilfældig belastning af topjorden. Nogle områder kan evt. være påvirket af trafikken (liniemodellen) eller af punktkilder (nedfaldsmodellen). Det antages, at forureningsniveauerne er højere:
I de ældste boligområder (>100 år) antages det, at det forurenede kulturlag findes til mere end 50 cm dybde, mens det i de nyere boligområder (<100 år) er afgrænset i 50 cm’s dybde. Det antages endvidere, at jordforureningen viser et varierende indhold (dvs. en vis spredning i de målte koncentrationer i jordprøver fra samme dybde i jordlaget i det afgrænsede testareal), og at nogle prøver kan være påvirket af belastningen fra trafik (liniemodel) eller punktkilder(nedfaldsmodel). Det antages, at forureningsparametrene er tungmetaller, polycycliske aromatiske kulbrinter (PAH), og olie samt evt. dioxiner, polychlorerede biphenyler (PCB), phthalater og pesticider. Det antages, at diffus jordforurening på testareal R, et rekreativt område, som aldrig har været anvendt til boligformål, har sin oprindelse i luftbårne emissioner fra de mange punktkilder i København igennem århundreder. Disse luftbårne emissioner vil også påvirke andre arealer i den indre by i København, dvs. svarende til nedfaldsmodellen. Det antages derfor, at forureningsniveauerne i nærliggende boligområder vil være højere end på testareal R, idet boligområder er yderligere påvirket af bidrag fra byggematerialer, boligopvarmning m.v. Således antages det, at byjord er mere forurenet end baggrundsniveauet i landområder. BaggrundsniveauerLitteraturværdier for baggrundsniveauer i landområder er angivet i tabel 2.1, 2.2 og 2.3.
Tabel 2.1 Medianværdier for tungmetalkoncentrationer i danske landområder /21, 22/ (mg/kg TS).
Tabel 2.2 Skønnede referenceniveauer for PAH i jord /1/ (mg/kg TS).
* ITE (NATO/CCMS) betyder internationale toksicitetsækvivalenter som defineret af NATO/CCMS. Tabel 2.3 Skønnede referenceniveauer for organiske stoffer i jord. 2.4 Afgrænsning af testarealerUndersøgelserne er udført ved 10 forskellige lokaliteter, anvendt til boligformål i Københavns Kommune (5 lokaliteter) og Ringsted Kommune (5 lokaliteter), samt på et referenceområde i Københavns kommune (kun anvendt til rekreative formål - park). Testarealerne er udvalgt, således at der i videst muligt omfang er områder uden tidligere industri og opfyldte arealer/lossepladser. Der kan dog have været baggårdsindustri på en del af arealerne. Den indre del af København blev etableret i 1100 og Københavns kommue har i dag en befolkning på ca. 500.000. Ringsted blev etableret i 1000 og har en befolkning på 67.000. Desuden er der inddraget data (bly og PAH) fra Københavns Kommunes undersøgelser af områder ved Brønshøj, Østerbro og Grøndal /36,34,37/. Testarealerne er afgrænset på grundlag af boligalder og byudvikling. Arealer med tidligere industri og opfyldte arealer/lossepladser er fravalgt. Der kan dog have været baggårdsindustrier på nogle af arealerne. I København er der foretaget undersøgelser ved følgende 5 testarealer, som er vist i figur 2.2:
Figur 2.2 Oversigtskort over den fysiske placering af testarealer i København I Ringsted er der foretaget undersøgelser ved følgende testarealer, som vist i figur 2.3:
Figur 2.3 Oversigt over den fysiske placering af testarealer i Ringsted 2.5 Opstilling af hypoteserDer er opstillet følgende hypoteser om relationerne mellem den diffuse jordforurening og den bymæssige anvendelse af områderne til boligformål. Hypoteser om undersøgelsesstrategien:
Hypoteser om forureningsmodellen:
Hypoteser om arealspecifikke analyseparametre:
2.6 Valg af analyseparametre og måleteknikker.Potentielle forureningsparametre er identificeret som arsen (As), bly (Pb), cadmium (Cd), chrom (Cr), kobber (Cu), kviksølv (Hg), nikkel (Ni), zink (Zn), PAH, olie, phthalater, PCB, pesticider og dioxiner /1/. Som indikatorparametre er udpeget tungmetallerne Pb, Cu, og Zn samt Miljøstyrelsens 7 PAH som er målt i alle prøver. De øvrige forureningsparametre er målt i et mindre antal prøver, se analyseplan i afsnit 2.10. TungmetallerDer er ønsket en vurdering af, om anvendelse af feltteknikken, EDXRF, til måling af As, Pb, Cr, Cu, Ni, og Zn er fordelagtig, hvad angår pris og effektivitet. Analyseusikkerheden er vurderet til 10 – 20 % ved EDXRF målinger for bly, kobber, nikkel og zink ved koncentrationer fra 40 - 200 mg/kg og genfindingen er omkring 70 - 150% /2/. Analyseusikkerheden og genfinding for arsen er derimod henholdsvis 48 % og 300 % ved lave koncentrationer (4 mg/kg). Analyseusikkerheden og genfinding for chrom er henholdsvis 96% og 300% ved lave koncentrationer (12 mg/kg)/2/. As, Pb, Cd, Cr, Cu, Ni, og Zn kan måles ved en ICP-analyseteknik, som typisk har en analyseusikkerhed på mindre end 15%. Hg kan måles ved en cold vapor teknik. Detektionsgrænser for de to teknikker er angivet i tabel 2.4.
Tabel 2.4 Detektionsgrænser ved analyse af tungmetaller PAHFor analyse af Miljøstyrelsens 7 PAH (fluoranthen, benzo(b)fluoranthen, benzo(j)fluoranthen, benzo(k)fluoranthen, benzo(a)pyren, dibenz(ah)anthracen and indeno(123-cd)pyren) kan der anvendes Miljøstyrelsens standardmetode, en GC-MS-SIM-teknik (jordprøven ekstraheres med toluen på rysteapparat i 16 timer). Analyseusikkerheden er angivet som mindre end 20%. En række prøver ønskes analyseret for et udvidet antal PAH (27) samt 4 grupper af alkylerede PAH (C3 –phenanthrener, C4 –phenanthrener, C2 –dibenzothiophener og C3 –dibenzothiophener). Formålet er at vurdere PAH-sammensætningen i diffus jordforurening i forhold til PAH-kilden. Resultaterne skal desuden indgå i Miljøstyrelsens projekt om baggrundsniveauer for PAH i jord. I /16/ er der indsamlet litteratur vedrørende PAH-sammensætning i forhold til PAH-kilder. Der er peget på visse PAH-forbindelser og indikatorer, som kan benyttes til vurdering af kilden. Bl.a. nævnes det, at methylerede PAH stammer fra olieprodukter, at reten (7-isopropyl-1-methyl-phenanthren) er en specifik indikator for afbrænding af nåletræ, og at coronen, anthanthren og benzo(ghi)perylen dannes i forbrændingsmotorer. Der er anvendt følgende fire indikatorer:
Den udvidede analyse for PAH kan udføres ved en GC-MS-SIM teknik (jordprøven ekstraheres med acetone/pentan ved behandling på ultralydsbad i 5 min. og rysteapparat i 2 timer). Analyseusikkerheden er angivet som mindre end 15%. Detektionsgrænserne er vist i tabel 2.5.
Tabel 2.5 Detektionsgrænser for organiske parametre OlieFor analyse af benzen, toluen, ethylbenzen, xylener og totalkulbrinter er anvendt Miljøstyrelsens standardmetode ved GC-FID (jordprøven ekstraheres med pentan efter ekstraktion på rysteapparat i 16 timer). Analyseusikkerheden er angivet som mindre end 20%. Detektionsgrænserne er vist i tabel 2.6.
Tabel 2.6 Detektionsgrænser for organiske parametre PCB og PhthalaterIndholdet af PCB og phthalater er målt ved en GC-MS-SIM teknik (jordprøven ekstraheres med acetone/pentan ved behandling på ultralydsbad i 5 min og rysteapparat i 2 timer). Analyseusikkerheden er angivet som mindre end 15%. Detektionsgrænserne er vist i tabel 2.7.
Tabel 2.7 Detektionsgrænser for organiske parametre DioxinerIndholdet af dioxiner (polychlorerede dibenzofurans og dibenzodioxins) måles ved GC/MS hos GfA Gesellschaft für Arbeitsplatz- und Umweltanalytik mbH, Tyskland. Detektionsgrænser er vist i tabel 2.8.
Tabel 2.8 Detektionsgrænser for dioxiner PesticiderPesticider (Atrazin, DDT +DDE +DDD, Dichlorbenil, Dieldrin, Lindan, Malathion, Parathion, Simazin) er målt ved GC-MS-SIM. Analyseusikkerheden er mindre end 15%. Detektionsgrænser er vist i tabel 2.9.
Tabel 2.9 Detektionsgrænser for organiske parametre 2.7 Design af forsøgsplanForureningsmodellen forudsætter, at forureningsniveauet i prøvetagningspunkterne i testarealet er sammenlignelige, idet der er tale om den samme belastning i området, men at der vil forekomme en vis variation på grund af lokale arealanvendelser, jordudskiftning m.v. Det forventes ikke, at der vil forekomme stigende eller faldende koncentrationer i bestemte retninger. Punktprøverne skal være repræsentative for det generelle forureningsniveau i fladen, og give et objektivt grundlag for beskrivelse af forureningsniveauet i ethvert vilkårligt punkt i fladen. Hertil er geostatistiske analyser velegnede. Til dokumentation af forureningsniveauet udtages derfor en række prøver fra prøvetagningsfelter tilfældigt fordelt over testarealet. Det sikres, at disse placeres med forskellig indbyrdes afstand inden for området, jf. figur 2.4. I prøvetagningsfelter af ca. 100 m² udtages jordprøver fra 1-5 punkter inden for prøvetagningsfeltet, jf. figur 2.4. For at bestemme variationerne i dybden udtages der prøver i forskellige dybder, som følger:
Dog udtages flest prøver i 2 - 10 cm’s dybde, dvs. jordlaget, hvor risikoen for eksponering er højst. I testareal R udtages også prøver fra 0 - 5 cm, dvs. selve jordoverfladen, inkl. græstørv. I resultatoversigten benævnes prøverne i forhold til dybden, f.eks.: 0,05 m’s dybde Afstanden mellem prøvetagningspunkterne i et prøvetagningsfelt er altid mellem 1 - 10 m. Prøvetagningsfelterne placeres i forskellige afstande fra hinanden fra 30 – 500 m. For testareal C - Guldbergs Plads og E - Tingbjerg er der anvendt et mindre tæt prøvetagningsnet, idet der alene skal laves screening af forureningsniveauerne. Vurdering af forureningsniveau og ensartethedFormålet er at bestemme variationen for koncentrationsangivelserne over testarealet. I forbindelse med den geostatistiske analyse sammenlignes data parvis i forskellige afstandsintervaller, f.eks. 0 - 10 m, 10 - 50 m, 50 - 100 m, 100 - 200 m, jf. figur 2.4, hvorved det undersøges, om observationer med lille indbyrdes afstand er mere ensartede end observationer med større fysisk afstand. Den geostatistiske analyse belyser forureningens rumlige fordeling (her i 2 dimensioner) over testarealet, dvs. at den estimerer koncentrationsniveauerne, samt om der er tendens til henholdsvis faldende eller stigende koncentrationer i bestemte retninger. Yderligere, og måske vigtigst, estimeres usikkerheden på estimatet af forureningsniveauet i testarealet. Vurdering af dybdemæssige forholdJordprøverne udtages i forskellige dybder fra overfladen (0,02 - 0,1 m) og ned til 1 m’s dybde, dog hovedsagelig i 0,1 m’s dybden. Vurdering af prøvetagningstæthed og fordel/ulemper med blandingsprøverDer udtages prøver fra 1 til 5 punkter fra prøvetagningsfelter på 10 x10 m. Prøverne udtages som stikprøver, idet den indbyrdes variation mellem prøver, udtaget tæt på hinanden (1-10 m) samt med større afstand (20 - 300 m), anvendes i databehandlingen til at vurdere om prøver fra forskellige prøvetagningsfelter er forskellige fra hinanden. Gennemsnittet for prøverne udtaget fra den samme felt svarer til resultatet for en blandingsprøve, men spredning kendes og konsekvenser ved brug af blandingsprøver kan vurderes. Vurdering af indikatorparametre og forureningssammensætningForureningsniveauet i et prøvetagningsfelt på 10 x 10 m antages at være sammenligneligt (på samme niveau). Derfor undersøges udvalgte prøvetagningsfelter intensivt, mens andre felter kan screenes ved et mindre antal prøvetagningspunkter. I alle prøver måles indikatorparametre og der udvælges passende prøver til analyse for de øvrige parametre. Den detaljerede prøvetagnings- og analyseplan udarbejdes på grundlag af besigtigelsen og retningslinierne i forsøgsplanen. Figur 2.4 Skitse over placering af prøvetagningsfelter i et testareal 2.8 PrøvetagningsplanBesigtigelsePå grundlag af kortmaterialet og forsøgsplanen er der udarbejdet et forslag til prøvetagningspositioner. Positionerne er placeret med henblik på at undgå forurenende punktkilder samt områder, hvor den oprindelige jord kan forventes at være bortkørt. Herefter er der foretaget en besigtigelse, og positionerne er justeret i henhold til observationer og adgangsforhold. I bymidten har det ofte vist sig at være problematisk at finde egnede prøvetagningspunkter, dvs. jord uden befæstelser. Antal af prøvetagningspunkterPrøvetagningspunkter er planlagt efter principperne som illustreret i figur 2.4. I tabel 2.10 og 2.11 angives antallet af prøvetagningsfelter og jordprøver for testarealer og referenceområde.
Tabel 2.10 Prøvetagningsplan for testarealer i København
Tabel 2.11 Prøvetagningsplan for testarealer i Ringsted 2.9 PrøvetagningsarbejdeEt feltteam bestående af to personer har udført borearbejde, prøvetagning, feltobservationer, indmåling og feltdokumentation. Jordprøverne er tilstræbt udtaget i jord, hvor der ikke jævnligt fortages jordarbejder, f.eks. i græsplæner, men ikke i bede. Prøvetagningen i hver felt er dokumenteret på et feltkort og observationer er noteret i en standard feltjournal med:
Herudover er der noteret observationer vedrørende:
Endelig er disse aktiviteter noteret:
Herudover er der i feltjournalen udført en geologisk beskrivelse af den opborede jord. Jordprøverne er udtaget med et håndbor ved at jorden fjernes indtil toppen af den ønskede jordprofil, hvorefter håndboret renses for jorden. Der er herefter udtaget en 10 cm jordprofil som én jordprøve. Brug af et karteringsspyd ville sandsynligvis give et mere præcist geologisk profil, men prøvetagningsmængden ville være alt for lille i forhold til analysebehovet. Endvidere kan man ved brug af håndbor fornemme fremmede genstande, mens der med et kvarteringspyd er en risiko for at banke spyddet igennem ledninger m.v. hvis disse ikke er meget præcist angivet på ledningsplanerne. Prøvetagningspunkter er indmålt ved en GPS-5700 med en nøjagtighed på 10 mm vandret og 20 mm lodret. Koordinator er angivet i system 34 Sjælland og terrænkote i DNN. GPS-målingerne er fortaget i forhold til signal fra ca. 6 – 8 satellitter. Signalet er dog svagt på visse tidspunkter om dagen. Disse tidspunkter kan i forvejen aflæses i en web-almanak /17/. Der kan desuden være forstyrrelser ved målinger tæt på høje bygninger eller under høje træer. Det anbefales derfor, at indmåle enkelte referencepunkter med GPS, så baggrundskort og indmålte boringer kan vurderes i forhold til hinanden. GPS- målingerne bør i øvrigt foretages i det koordinatsystem, som grundkortet findes i, da omregninger mellem de forskellige koordinatsystemer vil øge usikkerheden. Hver jordprøve har fået et entydig prøvenr. bestående af lokalitetens ID-Zone, ID-felt nr.-boringsnr. og en dybdeangivelse. Alle jordprøver er udtaget i rilsanposer, lagt i køletasker og transporteret til miljølaboratoriet (NIRAS), hvor der er målt PID og foretaget en geologisk beskrivelse. Der er udtaget delprøver til de forskellige analyser. Prøveemballage er fremsendt af analyselaboratorierne og bestod af redcap-glas til olie- og PAH-analyse iht. Miljøstyrelsens standardmetoder, teflonkopper til EDXRF-analyse, plastposer til tungmetalanalyse med ICP og tørstofbestemmelse samt rilsanposer til udvidet PAH-, PCB-, phthalat-, pesticid- og dioxinanalyser. 2.10 AnalysearbejdePID, pH, tørstofindhold og organisk indholdFor alle jordprøver er jordarten beskrevet og der er målt tørstofindhold, glødetab og PID-udslag (udslag målt med en Photoionisation-detektor, der giver udslag ved flygtige forureninger). For prøver udtaget i Ringsted er der desuden målt pH. TungmetallerAlle prøver fra prøvetagningsfelterne i København er analyseret for As, Pb, Cr, Cu, Ni og Zn (uden anden forbehandling end tørring, jf. konklusionerne i /3/) med en feltteknik (Røntgenfluorescens teknik - EDXRF) hos Teknologisk Institut i Århus. Tungmetalindholdet er herefter kontrolleret i ca. 10 – 20% af prøverne ved en akkrediteret ICP-analyseteknik (induktivt koblet plasma) hos AnalyCen, hvor der desuden er målt for Cd og Hg (cold vapor teknik). Alle jordprøver udtaget i Ringsted er analyseret for Pb, Cd, Cr, Cu, Ni og Zn ved en akkrediteret ICP-analyseteknik hos AnalyCen. Et mindre antal prøver (ca. 25%) er også analyseret for As og Hg. PAHAlle jordprøver fra København og Ringsted er analyseret for sum af MST 7 PAH (polycycliske aromatiske hydrocarboner) ved Miljøstyrelsens standardmetode med en GC-MS-SIM teknik (gaschromatografi med masse spektrometri og selektiv ion monitering) hos AnalyCen. Til vurdering af PAH-sammensætningen er en række prøver (ca. 20% af prøverne i 2-10 cm’s dybde) analyseret for et udvidet antal af PAH (27) samt 4 grupper af alkylerede PAH (C3 –phenanthrener, C4 –phenanthrener, C2 –dibenzothiophener og C3 –dibenzothiophener). Analysen er udført hos Eurofins ved en GC-MS-SIM-teknik OlieEn række prøver (ca. 10% af prøverne udtaget i 2- 10 cm’s dybde) fra København og Ringsted er analyseret for oliekulbrinter hos AnalyCen, og der er foretaget en vurdering af muligheden af, at prøverne har et naturligt indhold af kulbrinter, PAH m.v. Phthalater, PCB, dioxin og pesticiderCa. 3 - 10% af prøverne fra København og Ringsted er analyseret for phthalater (dimethylphthalat, diethylphthalat, di-n-butylphthalat, butylbenzylphthalat, DEHA, DEHP, di-iso-nonylphthalat og di-n-octylphthalat) og PCB (CB 28, CB 52, CB 101, CB 118, CB 153, CB 138, CB 180). Analyserne er udført ved GC-MS-SIM hos Eurofins (i ekstraktet fra en udvidet PAH-analyse). Desuden er ca. 3 - 5% af prøverne analyseret for dioxiner (polychlorerede dibenzofuraner og dibenzodioxiner). Denne analyse er udført ved GC-MS-SIM hos GfA Gesellschaft fûr Arbeitsplatz- und Umweltanalytik mbH, Tyskland. I Ringsted er en række prøver (ca. 3%) analyseret for pesticider (Atrazin, DDT +DDE +DDD, Dichlobenil, Dieldrin, Lindan, Malathion, Parathion, Simazin) ved GC-MS-SIM hos Eurofins. KvalitetsmålingerDer er udført nogle få analyser for tungmetaller, PAH og PCB på referencejord (standard). Der er ved udførelse af dobbeltbestemmelse på delprøver fra samme homogeniserede jordprøve foretaget en vurdering af analyseusikkerheden for målinger af tungmetaller med EDXRF og ICP samt for Miljøstyrelsens 7 PAH ved GC-MS-SIM. 2.11 Databehandling: Deskriptiv statistikDen deskriptive statistik giver et overblik over forureningsniveauet for de enkelte områder som helhed, men siger ikke noget om rumlige (spatielle) tendenser (f.eks. om forureningsniveauet aftager i en vis retning), som beskrives i afsnittet om geostatistisk. Der henvises til lærebøger om statistisk for en uddybende beskrivelse på de anvendte teknikker /15/. Resultaterne fra hvert enkelt testareal præsenteres med følgende parametre: minimum, maksimum og gennemsnit samt koncentrationerne som repræsenterer 10%, 25%, 50% (medianværdien), 75% og 90% datafraktiler. Resultaterne afrundes til to betydende ciffer i oversigtstabellerne. FraktilerVed beregning af fraktilværdier i oversigtstabellerne returneres kun målte værdier, hvis rangordenen svarer til de ønskede fraktiler, ellers interpoleres mellem de to værdier til hver side. Beregningen for den "k`te" fraktil på "n" antal datapunkter udføres som følger:
Ligeledes anvendes ved beregning af en medianværdi en interpoleret værdi for datasæt med et lige antal datapunkter. Det vil sige, at et datasæt opfattes som et kontinuum. I /15/ er der redegjort for nødvendigheden af interpolation, samt beregningsprocedurer, såfremt der ikke findes en "unik" værdi. Dette er ikke problematisk, hvis der er mange datapunkter, men mindre tilfredsstillende ved få data. Derfor vises ved mindre end 7 data alene min., max., medianværdien og evt. gennemsnittet. Desuden illustreres udvalgte analyseparametre som fraktilplot, hvor hvert datapunkt plottes som en fraktil, jf. /15/. På fraktilplottet kan der aflæses, hvilket datapunkt (X), der svarer til f.eks. 0,80 fraktil. Dette betyder, at 80% af dataene har koncentrationer svarende til eller er mindre end X. Fordelen ved et fraktilplot er, at alle datapunkter er vist, og figurens udseende herunder datafordelingen er uafhængig af koncentrationsintervaller(som f.eks. ved histogrammer). Data under detektionsgrænserDer er anvendt forskellige analysemetoder med forskellige detektionsgrænser, jf. tabel 2.4–2.9. Dette har dog ikke betydning, hvis resultaterne er væsentligt større end detektionsgrænserne, men er problematisk ved arsen, chrom og nikkel. Koncentrationsniveauerne for disse metaller i testarealer er typisk omkring eller under detektionsgrænsen for EDXRF-metoden, mens de ligger over detektionsgrænsen for ICP-metoden. Resultaterne for disse metaller er derfor vist særskilt for de to analysemetoder. I /15/ angives, at hvis 15% af dataene er under detektionsgrænsen, kan der anvendes en værdi svarende til
Hvis 15-50% af dataene er under detektionsgrænsen, kan der overvejes en datahåndtering, hvor der fjernes data fra begge ender af fordelingen. I så fald er der behov for en større datamængde og en symmetrisk fordeling. Såfremt 50 - 80% af dataene er under detektionsgrænsen, bør det overvejes at anvende andre parametre til beskrivelse af dataene, f.eks. 0,75 fraktil. Af hensyn til databehandlingen skal det generelt bemærkes, at resultater under detektionsgrænsen angives med en værdi svarende til det halve af detektionsgrænsen. Dette har betydning ved beregning af gennemsnitsværdien. I oversigtstabellerne er der derfor kun vist en værdi for gennemsnittet, hvis 85% af resultaterne er over detektionsgrænsen. I modsat fald er der kun vist minimum, maksimum og medianværdien. Medianværdien vil være upåvirket af data under detektionsgrænsen, hvis den ligger over detektionsgrænsen, men for at undgå misvisende fraktilværdier i oversigtstabellerne, anvendes betegnelsen "i.p." for resultater under detektionsgrænsen. Parametre med værdier under detektionsgrænserne er typisk chrom, nikkel og arsen samt enkelte PAH. GennemsnitGennemsnitsværdien kan være påvirket af metoden for angivelse af data under detektionsgrænsen. For at belyse problemet, er der med data fra Nyboder foretaget en følsomhedsanalyse for chrom, nikkel og arsen.
Tabel 2.12 Følsomhedsanalyse af metoden til beregning af gennemsnit (mg/kg TS) Som det ses af tabel 2.12, har anvendelse af resultater under detektionsgrænsen med en værdi svarende til det halve af detektionsgrænsen næppe betydning, når de fleste prøver er over detektionsgrænsen, som tilfældet er for chrom- og nikkelresultater (sammenlign I og II samt V og VI for Cr og Ni). Anvendelse af resultater under detektionsgrænsen med en værdi svarende til detektionsgrænsen betyder, at gennemsnittet er lidt højere. Derimod ses store forskelle i gennemsnitsberegninger for arsen, hvor detektionsgrænsen ved EDXRF ligger over koncentrationsniveauet for arsen. Desuden ses, at målinger af Cr ved EDXRF er mindre nøjagtige tæt på detektionsgrænsen (I -VI sammenlignes med VII). Datafordeling og betydning ved databehandlingHvis et sæt prøver repræsenterer punkter fra en normalfordeling, kan resultaterne beskrives ved gennemsnittet og variansen (symmetrisk spredning af data på hver side af gennemsnittet). Et sæt prøver fra en normalfordeling vil i praksis være begrænset til en endelig størrelse og vil derfor være t-fordelt. Histogrammerne for en normalfordeling med en stor varians vil være bredere end en fordeling med en lille varians som illustreres i figur 2.5. Figur 2.5 Histogrammer for to normalfordelinger med hhv. en stor og lille varians Figur 2.6 Histogrammer for lognormalfordelinger Miljødata viser derimod ofte en asymmetrisk fordeling af værdier med en lang hale til højre på fordelingen (høje værdier), jf. figur 2.6. Dette betyder, at forudsætningen for mange statistiske standard tests ikke er opfyldt. Da funktionen Y=ln(X) for lognormale data er normalfordelt, kan en logaritme- transformation af værdierne betyde, at dataene bliver tilnærmelsesvis normalfordelte. En sådan transformation er nødvendigt, hvis der skal anvendes statistiske tests eller geostatistiske databehandlinger, idet disse forudsætter, at dataene er normalfordelte, bl.a. ved beregning af gennemsnit og konfidensinterval for dette. I alle datatabeller vises dog gennemsnittet, selv om forudsætningen om en normalfordeling ikke nødvendigvis er opfyldt. Hvis gennemsnittet og 0,5 fraktil (medianværdien) er forskellige, er der tale om en asymmetrisk fordeling - hvis der f.eks. findes høje værdier, vil gennemsnittet være højere end median. Hvis dataene er normalfordelte (symmetriske omkring gennemsnittet), vil et fraktilplot have en S-form med en relativt flad sektion i midten. Derimod vil en stor spredning i koncentrationsniveauet betyde, at kurven stiger brat. Hvis dataene er asymmetriske med en lang hale (høje værdier) til højre ses en stejl stigning i den øverste højre del af kurven i forhold til den nederste venstre del. Miljødata kan dog også være anderledes fordelt, og man skal være opmærksom på dette, hvis forskellige datasæt skal sammenlignes. Udover tabellerne med deskriptiv statistik og fraktilplot er der desuden fortaget en analyse af datafordelingen. Til databehandlingen er anvendt forskellige værktøjer fra Excel og R (R er statistiske og grafiske værktøjer udviklet ved Bell Laboratories som "open source" og kan gratis downloades fra Internettet, http://www.r-project.org/). Kun resultater og særlig interessante figurer er inkluderet i rapporten. Det er analyseret, om dataene er normalfordelte med angivelse af følgende parametre:
Korrelation imellem parametrePearsons korrelation, R, imellem de enkelte parametre indikerer, om der er et lineart forhold imellem to parametre, hvor en positiv værdi på 1 betyder et perfekt positivt lineart forhold (begge parametre vokser) og en negativ værdi på –1 betyder et perfekt negativt lineart forhold (en parametre aftager, mens den anden vokser). En værdi tæt på 0 betyder, at der ingen korrelation er imellem parametre. Pearsons korrelation forudsætter normalfordelte data. Herudover kan der udføres regressionsanalyse, samt x-y plots med angivelse af R² (ofte benævnt forklaringsgrad), hvor R² ligeledes kan have en værdi mellem –1 og +1. Følgende beskrivelser i tabel 2.13 er anvendt i forbindelse med databehandling:
* Der kan stadig være en sammenhæng, men denne kan ikke belyses pga. utilstrækkelig datamængde Tabel 2.13 definition af beskrivelser ved korrelationsanalyse Sammenligning af datasætSåfremt fordelingerne ikke er normal eller lognormal anvendes en non-parametrisk test, "Wilcoxon Rank Sum Test" til at sammenligne data f.eks. fra forskellige dybder eller delområder. For normalfordelt data anvendes en t-test til at sammenligne gennemsnittet. 2.12 Databehandling: GeostatistikGeostatistikken anvendes til at vurdere rumlige (spatielle) tendenser og til at estimere koncentrationsniveauer samt usikkerheder for estimatet over et testareal. I bilag B er vedlagt en indledende beskrivelse af den matematiske teori ved geostatistisk. Geostatistikken bygger på, at målinger på prøver, der er udtaget tæt på hinanden, er mere ens end målinger på prøver, der er udtaget med større afstand. Målingerne siges, at være "korrelerede" inden for en vis afstand. Denne afstandskorrelation betegnes i det følgende som spatiel korrelation. Geostatistisk databehandling beregner forskel i varians mellem dataværdier, lokaliseret i forskellig afstand fra hinanden. Alle data inden for forskellige afstandsintervaller (lag), f.eks. 0-10, 10-20 m m.fl. sammenlignes parvis. Herefter laves et XY-plot af forskellen i variansen mod afstanden. Et XY-plot er vist i figur 2.7. Figuren kaldes et eksperimentalt semivariogram. Ved at vælge forskellige lagintervaller, ændres udseende af det eksperimentalt semivariogram. Det er således vigtigt at foretage følsomhedsberegninger og vælge realistiske lagintervaller i forhold til områdets størrelse og forventningen om forureningsspredningen. Figur 2.7 Et semivariogram Der kan generes teoretiske modellinier, som "fittes" til det eksperimentelle semivariogram og som beskriver det matematiske forhold for variansen mellem datapunkterne. Skæring af Y-aksen af den teoretiske modellinie, Co, betegnes "nugget" og er udtryk for summen af jordmediets mikrovariation og måle-/analyseusikkerhed, der vil bidrage til usikkerheden på estimatet af koncentrationen i ethvert punkt, uanset afstanden til nært beliggende målepunkter. I figur 2.7 er nuggetvarians = 0,1. Alle datapunkter, der ligger tættere end afstanden "R", range (som i figur 2.7 er 300 m), viser spatiel korrelation. Der siges, at data er korrelerede inden for en "range" af 300 m, dvs. jo tættere datapunkterne ligger, jo mindre er variansen mellem punkterne. Ved afstande større end "R", er variansen høj og tilfældig med en værdi svarende til omkring C0+ C1 - denne værdi betegnes "sill". I figur 2.7 er sillvarians = 0,3. Data er ikke korrelerede ved afstande større end "R", dvs. afstanden har ingen betydning for variansen mellem punkter med en afstand større end 300 m. Prøver udtaget tættere end afstanden "R" er korrelerede. Dette indikerer, at den maksimale prøvetagningsafstand bør være mindre end R hvis der skal ekstrapoleres mellem datapunkterne, f.eks. ved kortlægning. Udover at ekstrapolere (estimere) koncentrationsniveauerne i alle vilkårlige punkter ved hjælp af kriging, kan den teoretiske model anvendes til at beregne et konfidensinterval for de estimerede værdier. Kriging er en teknik til at interpolere mellem datapunkter. Der forudsættes at dataene udgør en regionaliseret variabel og forskellige metoder kan anvendes til at vægte de enkelte dataværdier. Hvis dataene alene viser "nugget" og ingen "sill" er der tale om et inhomogent medie uden spatiel korrelation. I sådanne tilfælde er det muligt at beskrive områdets data med et gennemsnit og konfidensinterval (dette forudsættes at data er normal- eller lognormalfordelte) eller med et interval, med f.eks. 5 og 95% fraktiler. Det er således vigtigt at finde en teoretisk model, som bedst beskriver semivariogrammet og dermed giver de bedste skøn for "nugget", "sill" og "range". En væsentlig del af databehandlingen i den geostatistiske databehandling omhandler tilpasning af den teoretiske model samt validering og krydsvalidering af denne for at sikre, at den matematiske løsning er korrekt og troværdig. Semivariogrammodellen kan anvendes til at forudsige (beregne) værdierne af de undersøgte parametre i vilkårlige punkter i planen. De beregningsalgoritmer, der anvendes er simpel kriging, ordinær kriging og universal kriging. De formelle i forskelle imellem disse metoder bør ikke negligeres. Simpel kriging forudsætter formelt at der er den samme forventningsværdi til den undersøgte parameter i hele det undersøgte område, hvorimod dette ikke er tilfældet for ordinær kriging. Universal kriging anvendes hvis der er en trend i variationen, der er betinget af f. eks fysiske forhold. Der er i nærværende undersøgelse udelukkende anvendt ordinær kriging. Alle tre metoder forudsætter at de parametre, der undersøges er normalfordelt En væsentlig styrke ved krigingsmetoden er at de estimerede værdier også er normalfordelte. Der beregnes derfor såvel et estimat som en standardafvigelse for dette estimat. Standardafvigelsen vil afhænge af især nugget, modellen og afstanden til de målte punkter i planen. Nugget må opfattes som mikrovariation, og i tilfælde af kemiske parametre som det er tilfældet her, også af prøvetagnings- og analyseusikkerhed. I denne undersøgelse er standardafvigelsen og normalfordelingsegenskaben anvendt til at estimere sandsynligheden for at et en prøve udtaget et givet sted i planen er større end jordkvalitetskriteriet (JKK). Tilsvarende er der estimeret en sandsynlighed for at et en prøve udtaget et vilkårligt sted i planen er mindre end afskæringskriteriet (ASK) for det pågældende stof. Ved at inddrage flere korrelerede parametre i en mulitivariate analyse styrkes den matematiske beskrivelse af et semivariogram, som nu kaldes et krydssemivariogram (da varians for flere parametre sammenlignes på kryds). De tilsvarende krigingsalgoritmer til at prediktere de analyserede parametre kaldes henholdsvis simpel cokriging, ordinær cokriging og universal cokriging. Cokriging giver et bedre prædiktion over (mindre varians, dvs. mindre usikkerhed) af de estimerede værdier sammenlignet med resultatet fra den tilsvarende univariate kriging og bør derfor anvendes, såfremt flere variabler samtidig undersøges /33/. Cokriging har imidlertid sin største fordel, hvor en eller flere variabler kun er målt i én fraktion af prøvetagningspunkterne. I praksis har det imidlertid vist sig vanskeligt at finde software, der kan håndtere manglende målinger, dvs. at der kun kan behandles datapunkter, hvor alle parametre er målt. Generering af krydssemivariogrammer har vist sig at være et effektivt værktøj ved modeltilpasning af det eksperimentelle semivariogram, idet flere variabler kan modelleres i en arbejdsgang. Men anvendelse af cokriging ved estimering af koncentrationsniveauer gav hyppigt numeriske problemer for det anvendte software. Det er ikke muligt her at redegøre detaljeret og systematisk for den teoretiske og matematiske baggrund for geostatistikken, dels fordi emnet er meget omfattende og dels fordi det ligger uden for rapportens formål - se i øvrigt bilag B. Men enhver, der anvender geostatistiske analyser, må dog opfordres til at opnå et minimum af indsigt heri. Der vil dog her blive nævnt nogle af de forudsætninger, de enkelte analyser hviler på, samt introduceret begreber og termer, der er anvendt i de følgende kapitler. Det kan anbefales, at der læses anden relevant litteratur, såfremt der ønskes en nærmere introduktion til den geostatistiske databehandling /30-33/. Kontrol af forudsætninger og fortolkningerDet kan i praksis ofte være vanskeligt at afgøre, om den undersøgte parameter opfylder de forudsatte antagelser og betingelser for den geostatistiske analyse. Det gælder ikke mindst antagelsen om normalfordelingen. Normalfordelingskravet kan undersøges med de metoder, der er nævnt i ovenstående afsnit om anvendte deskriptive metoder. Som det ofte er tilfældet med mange naturlige stokastiske variabler, er geokemiske data ofte lognormal fordelte. Det betyder, at det er nødvendigt at logaritme-transformere de pågældende parametre før analysen. Den estimerede koncentration og konfidensintervallet skal derfor tilbagetransformeres, før de kan anvendes ved kortlægning. Ved denne procedure introduceres en uundgåelig bias, der ses som et skævt konfidensinterval, med en forholdsvis høj øvre grænse. På trods af logaritmisk transformering af data forekommer der på grund af ekstreme værdier i flere tilfælde afvigelser fra normalfordelingen. Afvigelser fra normalfordelingen for det samlede datamateriale kan imidlertid også ofte skyldes forhold, der knytter sig til særlige spatielle forhold i det undersøgte område, det anvendte undersøgelsesdesign eller en kombination. I sådanne tilfælde kan datafordelingen undersøges isoleret i forskellige delområder. Såfremt betingelserne for en normalfordeling er tilnærmelsesvist opfyldt i disse delområder, anses det for forsvarligt at udføre analysen på området som helhed. Det kan ligeledes være nødvendigt med en særskilt undersøgelse af semivariogrammerne inden for forskellige delområder, idet variogrammet kan ændre karakter inden for det undersøgte område. Validering af den spatielle korrelation, som anvist af den valgte teoretiske model, kan testes med Moran's I-test. Testen er imidlertid tidskrævende og ikke særlig følsom. Derfor anvendes oftest grafiske metoder. Flere simple plot og grafiske afbildninger er relevante forud for konstruktionen af semivariogrammet. Der bør foretages følgende aktiviteter:
Scatterplot af kvadrerede differencer plottet mod afstanden mellem punktobservationer kan bidrage til et grundlæggende og simpelt billede af den spatielle korrelation, samt med informationer om den geografiske skala for variationen. Hvis der er en spatiel korrelation, må det forventes at de kvadrerede differencer vokser med afstanden imellem prøvepunkterne. Et scatterplot illustreres i figur 2.8. Ved spatiel korrelation må der forventes en positiv korrelation imellem de kvadrerede differencer og afstande inden for den korrelerede "range" for varians. En sådan korrelation kan evt. testes med Spearmans korrelationskoefficient, der er velegnet til at vurdere voksende (monotone) stokastiske funktioner. Spearmans korrelationskoefficient test er en såkaldt "fordelingsfri" rangtest. Figur 2.8 Illustration af et scatterplot af afstand og kvadrerede differencer imellem logaritmisk transformerede koncentrationer i parvise prøvepunkter for bly. Testareal B-Kartoffelrækkerne Ved evalueringen af variogrammet er det især vigtigt at evaluere de punkter i semivariogrammet, som viser større eller mindre hop eller dyk i estimerede semivarianser, idet disse også kan påpege særlige spatielle forhold på det undersøgte område (en vej, et areal med andet forureningsmønster m.fl.). Disse afvigelser er dog kun relevante, hvis de ses indenfor den korrelerede range for varians (mindre end 300 m i figur 2.7). Større eller mindre hop eller dyk i de estimerede semivarianser i et afstandsinterval (lag) større end "range" kan skyldes mere tilfældige irrelevante forhold snarere end de egenskaber, der er knyttet til den spatielle variation. Det kan være vanskeligt at vurdere, om semivariansen er en entydigt voksende funktion, især når nugget udgør en betydelig del af den totale variation, som det ofte kan være tilfældet for diffus jordforurening. Også her benyttes Spearmans korrelationskoefficient i det kritiske område fra lag=0 til lag > Range. Endelig er det vigtigt at vurdere, hvilken indflydelse ekstreme værdier har på variogrammet. Den mest sårbare kombination er ekstreme værdier kombineret med ekstrem beliggenhed. Evt. konstrueres variogrammet både med og uden disse værdier. Geostatistisk flowdiagramI figur 2.9 er de forskellige trin som gennemgås i forbindelse med en geostatistisk analyse opstillet. Figur 2.9 Flowdiagram for geostatistik Trin I: Er data normal- eller lognormalfordelte?
Trin 2: Analyse af spatiel korrelation
Trin 3: Beregning af spatiel forhold på arealet
Fordelen ved beskrivelsen af det spatielle (rumlige) forhold er, at koncentrationen beskrives som et kontinuum, og at det er muligt at håndtere mindre delområder, hvor der findes større eller mindre varians. Det vil sige, at estimatet for koncentrationsniveau og konfidensinterval samt sandsynligheden for, hvorvidt jorden på et givet sted i området ligger over jordkvalitetskriteriet, er baseret på de faktiske målinger i nærheden af stedet – altså den spatielle korrelation, idet målinger tæt på hinanden vil være mere ensartede end målinger foretaget på større afstande.
|