Kortlægning af diffus jordforurening i byområder. Delrapport 1

7. Statistisk behandling af data

7.1 Prøvetagningsstrategier
7.1.1  Metoder til lokalisering af hotspots
7.1.2 Metoder til vurderinger af overholdelse af jordkvalitetskriteriet
7.1.3 Jordbunker
7.1.4 Geostatistiske metoder.
7.2  Dynamiske arbejdsplaner
 

7.1 Prøvetagningsstrategier

7.1.1 Metoder til lokalisering af hotspots

I /104,105/ er beskrevet en tredimensional beregningsmetode til at bestemme sandsynligheden for at finde jordforureninger (hotspot) af en vis størrelse.

Metoden kan anvendes til at definere tætheden af et prøvetagningsnet, der skal til, hvis en hotspot af en vis størrelse skal lokaliseres med en vis sandsynlighed.

For eksempel er det nødvendigt med en gitterlængde på 5 m eller mindre, såfremt sandsynligheden for at finde jordforureningen skal være mere end 52%, under forudsætning af, at jordforureningen er beliggende i det øverste jordlag og har en diameter på 4 m.

Ved vurdering af diffust forurenet jord er det en forudsætning, at der ikke er punktforureninger(hotspots), idet en analyse- og prøvetagningstrategi for diffust forurenet jord ikke kan afdække punktforureninger.

Under databehandling af resultaterne fra undersøgelser for diffuse jordforureninger vil man dog kunne identificere datapunkter, som afviger fra den diffuse jordforurening. Afvigende datapunkter kan indikere punktforureninger, men fravær af afvigende datapunkter kan ikke sige noget om eventuel tilstedeværelse af punktforurening.

7.1.2 Metoder til vurderinger af overholdelse af jordkvalitetskriteriet

Såfremt der er tale om stoffer, hvor den kroniske skadevirkning har været afgørende for fastsættelsen af kvalitetskriteriet (f.eks. bly, cadmium, benzo(a)pyren og total PAH), kan et sammenhængende og anvendelsesmæssigt relevant forurenet areal vurderes forureningsmæssigt på basis af gennemsnittet af de forurenede prøver, jf. Miljøstyrelsen, /106/,.

For stoffer, hvor den akutte skadevirkning har været udslagsgivende ved fastsættelsen af kvalitetskriteriet (f.eks. arsen og nikkel), kan arealet anvendes til meget følsom arealanvendelse, hvis følgende to kriterier er overholdt:
Gennemsnittet af alle prøver ligger under det fastsatte jordkvalitetskriterie.
Højst 10% af prøverne ligger over det fastsatte jordkvalitetskriterie, og ingen prøver overskrider jordkvalitetskriteriet med mere end 50%.

I /105/ er der opstillet et regneark til vurdering af diffus jordforurening i forhold til meget følsom arealanvendelse, hvor gennemsnit og andelen af prøver, som overskrider jordkvalitetskriterierne for en række stoffer med jordkvalitetskriterier, kan beregnes for et datasæt.

Der forudsættes, at kun data fra et anvendelsesmæssigt relevant forureningspåvirket område vurderes samlet, og at der som absolut minimum foreligge analyser svarende til 5–10 prøvetagningspunkter pr. 400 m², /105,106,107/.

I geotekniske undersøgelser kan komprimeringsarbejdet dokumenteres ved, at gennemsnittet og mindste værdien for 5 tilfældigt udtagne prøver overholder kravværdien (i modsætning til kvalitetskrav for forureningsparametre skal komprimeringstestværdien være højere end kontrolværdien). Alternativt kan kontrolreglen overholdes ved en statistiske bedømmelse. Standardafvigelsen ganges med en konstant (k), som er afhængig af antal af målinger(n), dog minimum 5, og fratrækkes gennemsnittet. Resultatet skal være større end kontrolværdien, jf. tabel 7.1.

Tabel 7.1
Kontrolværdi ved komprimering af jord.
Statistical Control values for the consolidation of soils.

n

5

6

7

8

9

10

15

20

25

30

40

50

k

1,96

1,86

1,79

1,74

1,70

1,67

1,58

1,53

1,50

1,47

1,44

1,43

I UK er prøveantal for en lokalitet fastsat ved en statistisk metode, hvor det antages, at jordforureningen er opstået ved en jævn fladebelastning, og dermed at der findes et jævnt forureningsniveau i topjorden, /108/. Jo flere prøver der analyseres, jo bedre er bestemmelsen af jordens gennemsnitlige koncentrationsniveau (C) i forhold til den sande værdi (µ), som kan vurderes i forhold til et jordkvalitetskriterie (G).

Hypotesen om, at µ skal være mindre end G opstilles og kan testes ved forskellige konfidensintervaler. Prøveantal beregnes ud fra en statistisk metode med en "fuzzy" (grå) zone på 0,3G omkring G. Herefter kan det antal af prøver, der er nødvendige for at sikre en statistisk prøvetagningsstrategi, aflæses fra kurverne.

7.1.3 Jordbunker

I henhold til vejledning i håndtering af forurenet jord på Sjælland, /109/, skal forurenet jord klassificeres udfra de højeste fundne værdier for hver forureningsklasser, hvor følgende skal overholdes:
Gennemsnittet af alle prøver må ikke overskride grænseværdien.
Ingen enkeltværdi må overskride grænseværdien med mere end 50 %.

I forbindelse med oprensning af en gasværksgrund i UK, /110/ blev forskellige statistiske parametre og prøvetagningsstrategier afprøvet ved vurdering af total PAH-indhold i jordbunker. 50 jordprøver indeholdt fra 429 til 3.631 mg/kg med gennemsnit, standardafvigelser og medianen på henholdsvis 1.711, 1.462 og 1.480 mg total PAH/kg. Det er konkluderet at medianværdien viser mindre variation end gennemsnittet. Der skal udtages mindste 30 prøver for at beskrive en jordbunke, men dette antal kan reduceres til mellem 3–5 blandingsprøver, bestående af hver 10 prøver.

I Holland, /111/, har man tidligere haft en praksis for vurdering af jordbunker, hvor 100 prøver udtages og reduceres til to blandingsprøver, som herefter analyseres. Denne praksis er analyseret statistisk ved simulering med 30 modeller over den forventelige rumlige fordeling af forurening i jordbunkerne. Variationen var uafhængig af de fleste parametre såsom jordtype, forbehandling o.s.v., men organiske forureninger viste en væsentlig større koefficient af variation (20%) end uorganiske stoffer (10%). Undersøgelsen bekræftede, at for jordbunker med en heterogenitet på mindre end 200% prøvetagningsstrategien var acceptabel.

7.1.4 Geostatistiske metoder.

Flere udenlandske undersøgelser har vist, at jordparametrene (pH, bly m.fl.) har en rumlig afhængighed, men der er dog sjælden tale om en normalfordeling, /93/.

Derfor er det vigtig at afgøre, om indsamlede analysedata er normalfordelt, før en passende statistisk databehandling kan iværksættes. I /122/ anvendes en kulmulativt frekvensplot på sandsynlighedspapir, hvor log-normalfordelte populationer udgør en retlinie, hvis hældning afspejler populationens standardafvigelse. Subpopulationer optræder som tangenter til ret linien.

Geostatistiske metoder kan anvendes til adskillelse af sammenlignelige data (samme population, f.eks. diffus jordforurening) og ikke-sammenlignelige data (f.eks. punktkilder).

Geostatistiske metoder anvendes også til at evaluere rumlig fordeling af geokemiske data. Disse teknikker kan anvendes til:
at reducere prøvetagningsnettet (antal af datapunkter)
at skelne mellem sammenlignelige og ikke sammenlignelige data (outliers - data, som tilhører en anden population)
at interpolere dataværdier i nabofelter, hvorpå der ikke foreligger målinger (kriging - en teknik med vægtede gennemsnit)

Geostatistiske analysemetoder beregner varians, dvs. den statistiske forskel mellem dataværdier, lokaliseret i forskellig afstand fra hinanden. Alle data inden for en vis defineret afstand sammenlignes parvis. Hvis for eksempel prøverne udtages fra et 50x50 m net, beregnes varians ved 50 , 100, 150 og 200 m.v. Herefter laves et XY plot af varians mod afstand.

Figur 7.1.
Ideal form for en semivariogram, /93/.
Ideal form for a semivariogram.

I figur 7.1 viser alle datapunkter, der ligger tættere end afstanden "a", linear korrelation. Ved afstande større end "a" er varians konstant og lig med C, (som betegnes "a sill").

Prøver udtaget tættere end afstand "a" er overflødige punkter, og "a" er den optimale prøvetagningsafstand.

Figur 7.2
Semivariogram af bly med en 230 m net, /113/.
Semivariogram for lead with a 230 m net

I figur 7.2 vises et eksempel med blydata, som viser, at prøver udtaget tættere end 400 m (vist som "a" på figur 7.2), viser linear korrelation. Udtagning af prøver i 400x400 m net vil reducere antallet af prøvetagningspunkter med 50%, og stadig give de samme informationer om den rumlige fordeling af bly på det aktuelle areal.

Semivariogrammer kan have andre korrelationsformer end vist i figur 7.2, især hvis data ikke er normalfordelt. I sidstnævnte tilfælde kan der anvendes teknikker til at transformere lognormal data.

Vejledning om anvendelse af statistiske og geostatistiske værktøjer til planlægning og vurdering af miljøundersøgelser kan findes i en række rapporter og edb-modeller fra USA, som kan hentes som pdf filer, /112-117, 123/

Følgende referencer kan være nyttige:
Statistiske metoder – Practical Methods for Data Analysis, /112/. Rapporten angiver en række anvisninger og eksempler, f.eks. grafiske metoder (histogrammerne, normalsandsynlighedsplot, lognormal fordeling m.v.) til vurdering af, hvorvidt data er normaltfordelt. Der er bl.a. givet et oversigt over fordele og ulemper ved anvendelse af gennemsnit, den øvre fraktil eller median, ifm. vurdering af overholdelse af kvalitetskriterier.
Undersøgelsesteknikker, inklusive geostatistiske metoder – Site Characterisation for subsurface remediation, /93/. En beskrivelse af geostatistiske metoder samt deres anvendelse til forskellige former for undersøgelser.
GEO-EAS 1.2.1, /114/, Geostatistical Environmental assessment software. Et DOS program som sammen med en brugervejledning og et data eksempel giver en grundig oplæring i geostatistiske teknikker.
GEOPACK, /115/, A geostatistical software system. Geostatistics for waste management.
SCOUT, /116/, Databehandling program
Prøvetagning og strategier - Preparation of soil sampling protocols: Sampling techniques and strategies, /117/. Oplysninger om prøvetagning, blandingsprøver (composite samples), tilfældig prøvetagning (random), prøvetagningsfelter (stratified sampling) m.v. De geostatistiske metoder er omtalt uden forklaring eller eksemplar.

Ved en undersøgelse i Karlsruhe, Tyskland, /95, 99/, blev de geostatistiske metoder anvendt til at modellere afhængighed af metalkoncentrationer i byjord, samt til at identificere lokale punktkilder. Resultaterne er gengivet i afsnit 6.7.1. Ved geostatistiske metoder kan anvendes til at skelne mellem naturlige baggrundsniveauer, diffus byforurening og lokal punktforurening. Hypotesen er, at geokemiske data vil vise en rumlig afhængighed (sammenligneligheden falder med afstanden) og dette kan udtrykkes med et eksperimentalt semivariogram. Desuden kan det vurderes, om prøvetagningsnettet er tilstrækkelig tæt til at der kan foretages en vurdering af fordelingen af den diffuse jordforurening.

Det er, i /95/, konkluderet at modellering med geostatistiske metoder tillader vurdering af diffus jordforurening i forskellige skalaer. De geostatistiske metoder er især effektive til identificering af "outliers", som indikerer punktkilder eller jord, som er flyttet fra et andet sted. Metoden kan identificere det generelle billede af diffus jordforurening, og om forureningen er i overensstemmelse med den forventede fordeling for den aktuelle arealanvendelse. Metoden kan indikere den nødvendige tæthed for prøvetagningsstrategien. Modellering kan også anvendes til at identificere områder med en høj diffus jordforureningsgrad.

I Rotterdam, NL, /96/, er geostatistiske metoder er anvendt til at optimere prøvetagningsstrategien og opnå en bedre forståelse og overblik over jordforureningsforholdene i et industriområde på 333.000 m². Geostatistiske teknikker, dannelse af forureningskort vha. kriging og "block kriging", hvor følsomhed af arealanvendelse inddrages i modellen, har vist sig at være et effektivt værktøj, som især egner sig til faseopdelte prøvetagningsstrategier.

Et geostatistisk studie af bly baseret på 285 prøver i et 500x500 m net og et delområde på 169 prøver i et 200x200 m net foretaget i Woverhamton, UK, er beskrevet i /97/. Der blev desuden gennemført en geostatistisk simulering af sandsynligheden for overskridelse af jordkvalitetskriteriet (500 mg/kg). Det blev konkluderet, at metoden vil forbedre planlægningen af supplerende undersøgelser og risikovurderinger.

7.2 Dynamiske arbejdsplaner

US-EPA har udviklet en række træningsmoduler til optimering af undersøgelsesstrategierne, blandt andet følgende aspekter:
Optimering (økonomi, datamængder og tid) af analysestrategier ved anvendelse af feltmålinger.
Systematisk planlægning for at sikre en målrettet og optimeret indsats med udgangspunkt i den nødvendige dataindsamling, igennem alle faser fra den indledende undersøgelse til afværge- og kontrolfasen.
Dynamiske arbejdsplaner, hvor arbejdet justeres løbende til de indsamlede data og graden af overensstemmelse med den konceptuelle forureningsmodel.

Arbejdet er baseret på, at der opstilles en konceptuel forureningsmodel, og at der foretages en løbende revidering af modellen i den dynamiske beslutningsproces med en resulterende forbedring af kvaliteten af det udførte arbejde til følge.