[Forside] [Indhold] [Forrige] [Næste]

Opsamling af data for diffus forurening

2.0 Datamaterialet

2.1 Datamodel
2.2 Difjord database
2.2.1 Referencer- tabel
2.2.2 Prøveidentifikation
2.2.3 Prøveforeberedelse
2.2.4 Analyseparametre
2.3 Indhentning af data
2.4 Indlæsning og systematisering af data
2.4.1 Databeslutninger
2.5 Kvalitetssikring af data

Det gennemførte projekt til indsamling og systematisering af eksisterende data fra undersøgelser af diffuse jordforureninger har omfattet en række aktiviteter:

  • opstilling af datamodel, herunder fastlæggelse af relevante data til projektet,
  • opstilling af database til håndtering og systematisering af de indsamlede data,
  • indhentning af data hos amterne og en række udvalgte kommuner,
  • indhentning af koordinater til prøvetagningspunkter,
  • indlæsning og systematisering af data i databasen,
  • kvalitetssikring af indlæste data.

Aktiviteterne er beskrevet i det følgende.

2.1 Datamodel

Indledningsvis er der opstillet er datamodel med det formål dels at beskrive relevante dataelementer i projektet, dels at beskrive deres indbyrdes relationer. Dataelementer omfatter dels en række parametre (tal), dels en række logiske udsagn (ja/nej), og en række beskrivelser af forklarende karakter (tekst).

Overordnet er datamodellen opbygget i et hierarki, som en række emnegrupper der indbyrdes er underordnet hinanden, og sammenhængende ved en række entydige relationer, typisk en talkode.

Øverst i hierarkiet findes undersøgelsesrapporterne, som udgør den reference alle underliggende data er opstået fra. Derefter følger jordprøverne, arrangeret, således at alle jordprøver relaterer til den rapport, hvorfra de er hentet. Denne relation er således ganske enkel - en rapport - mange prøver.

Næste trin i hierarkiet udgøres af de elementer, der på forskellig vis er med til at beskrive jordprøven:

  • En historik.
  • En jordartsbeskrivelse.
  • En beskrivelse af forholdene omkring prøvetagningen.
  • En eller flere beskrivelser af mulige punktkilder.
  • Mindst én ofte mange analyseresultater.

De overordnede datarelationer i datamodellen er som vist i figur 2.1

Figur 2.1 Relationer mellem datagrupper i datamodellen og DifJord-databasen. Flere pile angiver en en-til-mange relation, mens en streg angiver en en-til-en relation.

Figur 2.1 Relationer mellem datagrupper i datamodellen og DifJord-databasen. Flere pile angiver en en-til-mange relation, mens en streg angiver en en-til-en relation.

 

2.2 DifJord Databasen

Til håndtering af data er DifJord-databasen opstillet. Databasen er opstillet i Microsoft Access 97, under styresystemet Windows 95.

DifJord-databasen består af dels en række resultattabeller symboliseret ved kasserne i figur 2.1, dels en række forklaringstabeller.

Resultattabellerne indeholder resultaterne fra det indsamlede datamateriale. Forklaringstabellerne indeholder værdier til at lette indtastningsarbejdet (f.eks. kommunenavne, analysemetoder o.a.). Forklaringstabellerne er med til at sikre en ensartet stavemåde f.eks. analysemetoder, jordarter, kommunenavne og lignende.

På figur 2.1 ses en grafisk præsentation af relationerne mellem resultattabellerne. Flere pile mellem de skitserede tabeller angiver en en-til-mange relation, mens en streg angiver en en-til-en relation. Eksempelvis er der mange jordprøver til en rapport, men kun en jordartsbeskrivelse til en jordprøve. Relationer mellem forklaringstabeller og resultattabeller er af hensyn til overskueligheden ikke medtaget, for nærmere forklaring se bilag 1.

I de følgende afsnit er resultattabellerne beskrevet.

2.2.1 Referencer - tabel

De indsamlede rapporter er i denne tabel nummereret med hvert deres unikke identifikationsnummer. Referencetabellen indeholder desuden faktuelle oplysninger så som titlen på rapporten, forfatteren, klienten og rapportdato.

I tabellen er der desuden mulighed for at beskrive formålet med den aktuelle undersøgelse, samt omtale andre forhold, der kan være umiddelbart relevante for læseren.

2.2.2 Prøveidentifikation

Alle analyserede jordprøver er defineret ved et unik jordprøveidentifikation nummer.

Prøveidentifikationstabellen indeholder, foruden det unikke id-nummer, det oprindelige prøvenummer og geografiske oplysninger om de enkelte prøvetagningslokaliteter. De geografiske oplysninger omfatter information om prøvelokalitetens adresse, matrikelnummer og koordinater.

Alle prøvetagningspunkter er registreret med koordinater (X,Y). I en række undersøgelsesrapporter er koordinaterne til de enkelte prøvetagningspunkter oplyst. Disse er umiddelbart anvendt i databasen. For øvrige prøvetagningspunkter er der foretaget en bestemmelse af koordinater til prøvetagningspunkterne ved hjælp af Kort- og Matrikelstyrelsen kortsystem.

Koordinaterne er angivet med reference til det aktuelle koordinatsystem. Følgende koordinatssystemer er anvendt: System 34, UTM32 eller UTM33.

2.2.3 Prøveforberedelse

For alle jordprøver er der samlet oplysninger om prøveudtagningen, den indledende forbehandling, jordartsbeskrivelsen, pH og tørstof målinger (TS). Alle data er samlet i resultattabellen Prøveforberedelse. Til hver enkelt jordprøve, er der knyttet en og kun en beskrivelse af prøveforberedelsen.

Data omkring prøveudtagningen omfatter bl.a. prøvetagningsdybde/-interval, antallet af delprøver, der indgår i den analyserede jordprøve og jordartsbeskrivelse.

Forbehandling af jordprøven beskriver, hvilke mekaniske processer jordprøven er udsat for inden den efterfølgende ekstraheres/oplukkes på laboratoriet. Forbehandlingen omfatter bl.a. mulighed for homogenisering, sigtning, sortering af prøvematerialet (f.eks. fjernelse af sten, organisk materiale m.m.).

Tabellen indeholder også informationer om måling af jordprøvens pH-værdi og TS, og resultatet af den aktuelle måling, hvis det er medtaget i rapporteringen. En del analyseresultater er for eksempel omregnet til mg/kg TS, men uden angivelse af TS indholdet.

En række af de udførte undersøgelser af den diffuse jordforurening er relateret til en given forureningskilde, f.eks. afkast eller støv fra virksomheder, trafik eller lignende. I disse tilfælde angives de(n) formodede kilde(r). For de enkelte kilder er der herefter mulighed for en række supplerende data om f.eks. periode, eventuel afstand osv. De supplerende data håndteres i resultattabellerne: Trafik, PunktKilde, Anden Kilde og Områdekarak. Disse 4 tabeller anvender alle jordprøvernes unikke identifikationsnummer som reference.

2.2.4 Analyserparametre

Jordprøverne kan være analyseret for indhold af PAH-forbindelser og/eller tungmetaller. Analyseresultaterne er struktureret i de to resultattabeller: PAHanalyser og Metalanalyser.

For alle analyser er der defineret et unik analyseidentifikationnummer. Det er en en - mange relation, en jordprøve kan have mange analyseresultater.

I tabel 2.1 er vist hvilke analyseparameter der er medtaget i databasen.

Metalanalyseparametre PAH-analyseparametre
Bly (Pb) Total PAH
Kviksølv (Hg) Acenaphthen
Cadmium (Cd) Acenaphtylen
Nikkel (Ni) Antracen
Krom (Cr) Benz(a)antracen
Kobber (Cu) Benz(b)fluoranthen
Zink (Zn) Benz(j)fluoranthen
Arsen (As) Benz(k)fluoranthen
Platin (Pt) Benz(a)pyren
    Benz-g,h,i-perylen
    Chrysen
    Dibenzo-a,h-anthracen
    Fluoranthen
    Fluoren
    Indeno(1,2,3-cd)pyren
    Naphtalen
    Phenanthren
    Pyren
    Total kulbrinter

Tabel 2.1 Analyseparametre der er medtaget i DifJord-databasen

Analysetabellerne indeholder desuden en lang række supplerende data om f.eks. analysemetode, detektionsgrænse, prøveforbehandling Hovedteksten startes her. Afstanden fra overskriften er automatisk defineret.

2.3 Indhentning af data

Dataindsamlingen er foretaget hos landets 14 amter, Københavns og Frederiksberg Kommuner. Endvidere er Århus, Odense, Ålborg og Esbjerg kommuner kontaktet med hensyn til eventuelle data.

Dataindsamlingen er gennemført ved en indledende skriftlig kontakt til ovennævnte, en efterfølgende telefonisk drøftelse af relevante sager og i en række tilfælde besøg på de enkelte forvaltninger. Ved dataindsamling er der indhentet kopi eller uddrag af de relevante undersøgelsesrapporter samt i visse tilfælde datadisketter med tekniske data fra undersøgelsen.

2.4 Indlæsning og systematisering af data

I forbindelse med indlæsning af data i DifJord-databasen er det besluttet, at kun eksakte oplysninger medtages. Det betyder, at der ikke er foretaget skøn i forbindelse med indtastningen. F.eks. kunne det med rimelighed skønnes, at alle undersøgelser i byområder havde relation til forurening som følge af "byluft", men det er ikke markeret i databasen med mindre, at det eksplicit er nævnt i rapporterne eller tilhørende materiale. I andre tilfælde er det relativt sikkert, at der ved prøvetagningen er sket en frasortering af større genstand, men heller ikke det er medtaget, med mindre det eksplicit er nævnt. Der er ikke gjort forsøg på at fremskaffe supplerende eller manglende oplysninger til de enkelte sager. Eneste undtagelse fra dette er, at alle prøvetagningspunkter er angivet med koordinater.

2.4.1 Databeslutninger

I forbindelse med indtastning af data har der typisk været en række situationer, hvor det har været nødvendig at definere regler/retningslinier for den forsatte indtastning. I tabel 2.2 er disse regler/retningslinier vist.

1: For prøver udtaget indenfor et lille geografisk område kan der evt. anvendes et koordinat- sæt, svarende til tyngdepunktet af prøvetagningspunkterne.
2: Koordinatakser: Nord er x, Øst er y.
3: Hvis analyseresultaterne er opgivet i mg/kg TS, skal feltet tørstofbestemmelse være markeret (selvom tørstofindholdet ikke oplyses). Det er det eneste sted, hvor forskel på analyseresultater opgivet i TS og VV kan identificeres.
4: Trafik - jordprøver udtaget indenfor vejens ydre afgrænsning (dvs. den faste belægning), i f.eks. vejmidten tildeles afstanden 0 meter.
5: Angives der flere veje som de nærmeste betydende, anvendes data fra den vej, hvis afstand er mindst fra prøvepunktet.
6: Ved kalibreringsanalyser skal begge analyser markeres. Vær opmærksom på, at de to prøver skal have samme oprindelige prøvenummer.
7: Når en analyse angives med to analyseresultater som følge af for stor spredning på dobbeltbestemmelsen, lades koncentrationsfeltet tomt, mens der i feltet MAT_TEGN anvendes "=". Analyseresultaterne for de to enkeltbestemmelser skrives i kommentarfeltet.
8: I tilfælde af, at analyseresultaterne på den samme jordprøve er opgivet som to enkeltbestemmelser i rapportmaterialet, anvendes begge analyseresultater i databasen. Jordprøvens oprindelige prøvenummer er da mærket med litra a og b.
9: For visse PAH-forbindelser er det ikke alle de specifikke isomere, der er bestemt ved de kemiske analyser, f.eks. benz(b)fluoranthen henholdsvis benz(j)fluoranthen og benz(k)fluoranthen. I visse tilfælde opgives en eller to af parametrene eller de opgives som en sum af flere parametre, som f.eks. benz(b,j)fluoranthen. I disse tilfælde er det kun de specifikke analyseresultater, der anvendes i databasen.

Tabel 2.2 Anvendte regler og retningslinier for indtastning af data i DifJord-databasen.

2.5 Kvalitetssikring af data

Efter indlæsning af de modtagne data er der foretaget en kvalitetssikring af dataindlæsningen i DifJord-databasen.

Kvalitetssikringen er gennemført som følgende:

  • Antallet af analyser, fordelt på analyseparametren, på de enkelte rapporter er kontrolleret.
  • For alle analyseparametrene er de 10 - 20 største enkeltværdier kontrolleret i originalmaterialet.
  • På 3 tilfældigt udvalgte rapporter/datamaterialer er der gennemført en gennemgang af alle indlæste data.

Den gennemførte kvalitetssikring viste, at der forekommer indtastningsfejl, men i begrænset antal


[Forside] [Indhold] [Forrige] [Næste] [Top]