Datamodel for jordforurening

4 Metode

4.1 Fase 1: Foranalyse
4.2 Fase 2: Datamodellering
4.3 Fase 3: Design og rapportering
4.4 Kvalitetssikring

4.1 Fase 1: Foranalyse

Indledningsvist er opstillet en "bruttoliste" over emner og oplysninger, som er indeholdt i datamodellens område. Med afsæt i denne bruttoliste er der foretaget en tematisk afgrænsning af modelområdet jf. afsnit 2.1, og der er formuleret databærende entiteter for modellens genstandsfelt. Entiteten er den informationsbærende enhed af blivende interesse og omfatter her eksempelvis en forurening eller en jordtransport. Entitetens dataindhold formuleres som dataelementer, og for hvert dataelement er udarbejdet en definition (beskrivelse af indhold) datatype, enhed samt eventuelt datainterval og valgliste. Modelleringsprocessen er illustreret på figur 4.1

Figur 4.1:
Struktur bestående af temaer, entiteter, dataelementer og dataelementbeskrivelser /6/

4.2 Fase 2: Datamodellering

I forbindelse med datamodellering viser det sig ofte, at enkelte entiteter kan deles op i forskellige forekomster. Eksempelvis er entiteten Projekt blevet delt op i subentiteterne Afvarge, Felt_Under og Historisk_Under, som bærer informationer om afværgeprojekter, feltundersøgelser og historiske undersøgelser respektive. Projekt er superentitet til subentiteterne. I lighed med objektorienteret teori, så nedarver en subentitet dens superentitets definitioner, regler mv. Princippet er illustreret i figur 4.2.

Se her!

Figur 4.2:
Dataindhold og regler nedarves fra superentitet til dens subentiteter

Entiteternes indbyrdes afhængigheder beskrives herefter i form af relationer af blivende interesse entiteterne imellem. Relationerne kan i visse tilfælde være databærende. I forbindelse hermed er der udarbejdet en egentlig datamodelbeskrivelse bestående af entitets-/relations-diagrammer (E/R-diagrammer1) og skabeloner. Skabelonerne redegør for entiteterne, subentiteter og relationerne som helhed med navn, definition og beskrivelse mv. På samme måde er der udarbejdet skabeloner for dataelementer med angivelse af definitioner, datatyper, enheder, dataintervaller og valglister. Overgangen fra E/R-diagram til skabeloner er illustreret i figur 4.3. Ved opstilling af E/R-diagrammet er anvendt Chen-notation /15/.

Figur 4.3:
Entitet/relations-diagram (E/R-diagram) og skabeloner

Et simplificeret E/R-diagram for datamodellen fremgår af bilag A. Skabeloner indeholdende beskrivelser af entiteter, subentiteter, relationer og dataelementer fremgår af bilagene C til F i den tilhørende bilagsrapport.

4.3 Fase 3: Design og rapportering

I design- og rapporteringsfasen er datamodellen på logisk form implementeret som databasetabeller. Indledningsvist er foretaget en såkaldt "klokkeren implementering", hvor entiteter, subentiteter og relationer er omdannet direkte til tabeller. Der er herefter foretaget en vurdering af den herved fremkomne tabelstruktur i det særlige behov for hensigtsmæssige opslag er vurderet, jf. f.eks. diskussionen om tabellerne "Organisation" og "Privatperson" i afsnit 3.2.

Relationer omdannes kun til tabeller, når der er tale om "mange til mange" relationer. Omdannelse fra E/R-diagram til databasetabeller er illustreret på figur 4.4.

I design- og rapporteringsfasen er tillige undersøgt, hvilke brugerkrav der kan forventes til datamodellen. Her tænkes på udtræk, statistiske nøgletal og indrapportering til Miljøstyrelsen jf. cirkulære herom /13, 14/. En detaljeret svartidsanalyse kan dog ikke udføres uden en "virkelig" database, hvorfor typiske forespørgsler er simuleret "på skrivebordet".

Figur 4.4:
Omdannelse af entiteter og relationer til tabeller

Datamodellen er designet uden brug af autogenerede primærnøgler. Der er i stedet udpeget databærende unikke indeks, hvor det er tilstræbt, at de som nøgler anvendte dataelementer er entydige, varige og unikke på landsplan. Anvendelse af databærende nøgler forudsætter dels, at disse altid udfyldes ved brug af datamodellen og dels, at den ved implementeringen anvendte platform kan håndtere kaskadeopdatering ved ændring af databærende nøglefelters indhold.

Databasediagram fremgår af bilag B i den tilhørende bilagsrapport.

4.4 Kvalitetssikring

Datamodellens logiske struktur er kvalitetssikret ved kontrol af følgende:
Normalisering. Det er undersøgt, hvorvidt modellen er i Boyce-Codd normalform.
Unik identifikation for entiteter, subentiteter og relationer er kontrolleret.
Referentiel integritet er undersøgt for sammenhængen primærnøgler/fremmednøgler.

Datamodellens indholdsmæssige beskrivelser, dvs. definition og afgrænsning af entiteters, subentiteters og dataelementers genstandsfelt og gyldighedsområde er løbende kontrolleret af arbejdsgruppen bag modellen.

1 E/R-diagrammer dækker også subentiter