En registerundersøgelse af den danske befolkning

3 Materiale og metoder

3.1 Undersøgelsens design

Undersøgelsen er en partiel økologisk undersøgelse, der sammenligner sygeligheden hos beboere med enkeltvand- og almen vandforsyning. Der findes individbaserede oplysninger om sygelighed, mens bopælsadresse og vandforsyningsmåde anvendes som markør for eksponering. Da de små enkeltvandforsyningsanlæg ofte er placeret i det åbne land og ikke i større byer, vælges sammenligningsgruppen som ”landbefolkningen”, dvs. den del af befolkningen, der har almen vandforsyning og ikke bor i de større byer. Dette valg er truffet på baggrund af, at sygelighedsmønstret i hovedstaden og andre større byer er anderledes end i resten af befolkningen. CPR-numre på beboere med enkeltvandforsyning og CPR-numre på ”landbefolkningen” identificeres, og disse sammenkobles med information fra de sundhedsfaglige registre: Cancerregisteret, Fødselsregisteret, Misdannelsesregisteret og Landspatientregisteret.

3.2 Beskrivelse og anskaffelse af data fra de anvendte registre

3.2.1 Det centrale personregister (CPR registret)

CPR-registeret blev oprettet den 2. april 1968, hvorefter alle personer med fast bopæl i Danmark har fået tildelt et personnummer. CPR-registeret administreres af CPR-kontoret, der er et kontor i Indenrigs- og Sundhedsministeriets departement. CPR-kontoret fungerer som central leverandør af basale personoplysninger til offentlige myndigheder og den private sektor. Oplysninger vedrørende kontaktoplysninger og regler mv. i forbindelse med dataudtræk kan ses på CPR-kontorets hjemmeside på www.cpr.dk. CPR-systemet er reguleret af Lov om Det Centrale Personregister (CPR-loven), jf. lovbekendtgørelse nr. 140 af 3. marts 2004. Den egentlige lovtekst kan findes via Retsinfo på www.retsinfo.dk .

Udover personer med fast bopæl i Danmark er det ligeledes muligt at have et CPR-nummer i de tilfælde, hvor der er en administrativ begrundelse herfor. Dette kan f.eks. være af skatte- eller pensionshensyn eller i forbindelse med udenlandske personers deltagelse som hovedperson i en kirkelig vielse i Danmark. CPR-numre, der tildeles til personer, der er bosiddende udenfor Danmark betegnes som administrative CPR-numre, og disse tildeles specielle koder, således de kan adskilles fra almindelige CPR-numre.

CPR-nummeret består af en 10 cifret kode, der opbygges på følgende måde: Fødselsdag (01-31), fødselsmåned (01-12), fødselsår (00-99), løbenummer (3 cifre) og kontrolciffer (0-9). Kontrolcifferet anvendes dels til kodning for køn (ulige = mand, lige = kvinde) dels til kontrol af CPR-nummeret vha. modulus-11. Kombinationen af løbenummer og fødselsår anvendes ligeledes til bestemmelse af fødselsårhundrede. Når en person er blevet tildelt et CPR-nummer, følger det pågældende CPR-nummer personen for resten af livet. CPR-nummeret kan alene ændres, såfremt det kan dokumenteres, at der er uoverensstemmelse mellem den faktiske fødselsdato og/eller køn og de tilsvarende oplysninger i CPR-nummeret.

CPR-registeret indeholder oplysninger om personlige forhold, herunder bl.a.: CPR-nummer, Navn, Fødselsdato, Adresse, Tilflytning, Fødested, Status (herboende/udvandret/forsvundet/død mv.), Ægteskabeligt forhold (gift/ugift/fraskilt/enke), Ægtefælle og Forældre. For registrering af status og ægteskabeligt forhold registreres ligeledes begyndelsesdato. CPR-registeret opdateres løbende i forbindelse med opdatering af personoplysninger i folkeregistrene. Oplysninger, der opdateres med nye indberetninger, registreres herefter med afslutningsdato og er således ikke gældende længere. Eksempel herpå er f.eks. registrering af bopæl, hvor en flytning resulterer i opdatering af adresseoplysninger, hvorved den tidligere adresse lukkes med fraflytningsdato.

Selvom CPR-registeret er oprettet til administrative forhold, er det ligeledes muligt at anvende det til forskningsmæssige opgaver. Værdien i forhold til miljømedicinske projekter er især oplysningerne omkring nuværende og tidligere bopæl, idet det f.eks. i forbindelse med udredning af en given eksponering, der knytter sig til en ejendom eller et område ikke er ligegyldigt, hvor længe en person har været udsat for den pågældende eksponering.

I nærværende projekt er oplysningerne omkring nuværende og tidligere bopæl anvendt med henblik på bestemmelse af de vandforsyningsforhold, hver enkelt person i undersøgelsespopulationen har haft gennem undersøgelsesperioden.

3.2.2 Bygnings- og boligregistret (BBR registret)

Bygnings- og boligregisteret (BBR) er et landsdækkende register oprettet i 1976, som indeholder oplysninger om bygnings- og boligforhold. Registeret omfatter udover den almindelige boligmasse ligeledes oplysninger om specielle bygninger, som f.eks. kirker, hospitaler og slotte mv. Registeret anvendes både af statslige, amtskommunale og kommunale myndigheder samt af forsyningsselskaber og private virksomheder, som f.eks. ejendomsmæglere og realkreditinstitutter mv. De fleste oplysninger i BBR er gratis og offentligt tilgængelige via den Offentlige Informations Server (www.ois.dk). I forbindelse med masseudtræk, som f.eks. til registersamkøringsprojekter, er det dog nødvendigt at anskaffe udtrækket via en godkendt OIS-datadistributør. En liste over godkendte distributører kan ligeledes findes på www.ois.dk. Det skal bemærkes, at distributørerne opererer med forskellige priser, hvorfor det kan anbefales at kontakte flere forskellige med henblik på en forhandling om udgifterne til dataudtræk fra OIS.

BBR ligger til grund for beregning af ejendomsvurderingerne, ligesom forsyningsselskaberne anvender BBR i forbindelse med planlægnings- og analyseopgaver og ved fastsættelse af afgifter. Det er Erhvervs- og Byggestyrelsen, der har dataansvaret for BBR, men det er kommunernes opgave at ajourføre, opdatere og vedligeholde data. Registeret opdateres løbende via kommunernes inddatering af data bl.a. i forbindelse med byggesagsbehandling. Den enkelte ejer er forpligtet til at rette henvendelse til kommunen, såfremt det konstateres, at der er ukorrekte data i BBR. BBR opdateres 5 gange ugentligt og afspejler således de aktuelle forhold i ejendomsmassen i Danmark, hvis de indberettede oplysninger er korrekte.

BBR indeholder ikke historiske oplysninger, idet opdateringer i registeret erstatter tidligere inddateringer. Dette er fra en miljø- og sundhedsmæssig tilgangsvinkel uheldigt, idet det derved ikke er muligt fuldt ud at anvende de historiske oplysninger i CPR-registeret. Netop dette problem er aktuelt i nærværende projekt, idet adresser, der er registreret i BBR tilhørende en almen vandforsyning, få dage inden dataudtrækket kan have været forsynet fra enkeltvandsanlæg. Herved kan der opstå fejl i eksponeringen af den enkelte person.

BBR er opbygget i tre niveauer, hhv. Ejendom, Bygning og Enhed. Inddelingen skyldes, at nogle oplysninger henviser til hele ejendommen, der kan bestå af flere bygninger, hvoraf nogle bygninger kan bestå af flere enheder. Et eksempel herpå kan være en ejendom, der består af en matrikel med bebyggelse på. Bebyggelsen kan være opdelt i en ejendom og nogle garageanlæg. Ejendommen kan inddeles mellem nogle enheder, f.eks. et erhvervslejemål og en del, der er indrettet til beboelse.

3.2.3 Officielle Standardadresser og Koordinater (OSAK)

I Officielle Standardadresser og Koordinater (OSAK) ligger adresserne ligesom BBR på www.ois.dk, og formålet med OSAK er at sørge for, at der ét sted kan findes et adressedatasæt, som de enkelte kommuner har fastsat. OSAK er genereret som foreningsmængden af adresser registeret i BBR og KRR (Kryds Reference Registeret). Hver enkelt adresse i OSAK er forsynet med koordinater, der refererer til det internationale koordinatsystem UTM/ETRS89, og OSAK opdateres ca. en gang om måneden.

OSAK indeholder i alt ca. 2,2 mio. adressepunkter med tilhørende koordinater. Koordinaterne repræsenterer husnumre og ikke boenheder, således vil etageejendomme alene have tilknyttet én koordinat, svarende til én gadedør. Udover koordinater er hvert enkelt adressepunkt refereret til Det Danske Kvadratnet, et standardiseret grid dækkende hele Danmark. Kvadratnettet er opdelt i 5 maskestørrelser, hvoraf OSAK refererer til tre, med maskestørrelsen på hhv. 100 meter, 1 km og 10 km. Denne reference kan anvendes i de tilfælde, hvor det ikke har været muligt at tilknytte koordinater til en adresse, hvorved det er muligt at angive en omtrentlig placering af adressen.

3.2.4 Befolkningsdata på kvadratnet

Projektgruppen vurderede, at social status var en vigtig mulig konfounder, som der skulle indhentes oplysning om. Traditionelt er socialstatusdata til sundhedsfaglige forskningsprojekter leveret af Danmarks Statistik, men på grund af deres politik mht. datahåndtering og udlevering af data fandt projektgruppen det ønskværdigt at afsøge alternative løsninger. En mulighed var anvendelse af kvadratnet-data, idet en dataleverandør har oplysninger om variable, der kan anvendes som proxy for socialstatus fordelt på kvadratceller.

Kvadratnettet er et officielt standardiseret kvadreret net, der dækker hele Danmark og forefindes med 5 forskellige maskestørrelser, hhv. 100 km, 10 km, 1 km, 2 50 m og 100 m. De enkelte kvadratnet genereres af et stykke software der er gratis, og som kan downloades via Kort og Matrikelstyrelsens eller Danmarks Miljøundersøgelsers hjemmesider (www.kms.dk eller www.dmu.dk). Programmet kan genere kvadratnet i flere forskellige formater, der er kompatible med de mest almindelige GIS værktøjer anvendt i Danmark.

I dette projekt er der arbejdet med et kvadratnet med følgende variable: Velstandsfaktor, uddannelsesfaktor, boligfaktor og beskæftigelsesfaktor, hvor alle variable er opdelt i standardiserede intervaller fra 1-10. Definitionen af de enkelte variable er foretaget af dataleverandøren, og grunddata er data fra Danmarks Statistik. Det er vurderet af projektgruppen, at disse variable ville kunne anvendes til social standardisering i forbindelse med de statistiske analyser. Et eksempel på kvadratnetdata kan ses i figur 8.

Klik her for at se figuren.

Figur 8
Et eksempel på den geografiske repræsentation af kvadratnetdata, for Københavnsområdet. OBS ikke copy right, GEUS??

3.2.5 Areal information System (AIS)

I forbindelse med afgrænsning af undersøgelsespopulationen er det nødvendigt at kende fordelingen mellem by og land. Flere forskellige datasæt indeholder oplysninger om placering af byer. I dette projekt er det valgt at anvende AIS data (AIS = Areal Informations System), idet data til forskningsprojekter kan downloades frit fra DMUs hjemmeside (www.dmu.dk).

Areal Informations Systemets data er skabt i perioden 1996-2000 som et samarbejdsprojekt mellem Danmarks Miljøundersøgelser (DMU), Danmarks og Grønlands Geologiske Undersøgelse (GEUS), Forskningscentret for Skov & Landskab (FSL), Skov- og Naturstyrelsen (SNS), Miljøstyrelsen (MST), Energistyrelsen (ENS), Kort & Matrikelstyrelsen (KMS), Landsplanafdelingen (LPA), Ministeriet for Fødevarer, Landbrug og Fiskeri, amterne, Københavns Kommune samt Farvandsvæsenet.

3.2.6 GEUS’s Jordartskort

Siden 1888 har DGU (nu GEUS) kortlagt Danmarks overfladegeologi, dels som en generel kortlægning af naturen og dels til brug ved vurdering af jordens bonitet o.l. Kortlægningen er foretaget i målestoksforholdet 1:25.000 (dog 1:20.000 før 1978). Informationerne er indsamlet ved feltarbejde, hvor jordprøver tages med 100-200 meters mellemrum under kultur- og pløjelag med et karteringsspyd. Prøverne vurderes i felten og resultatet noteres ned på et kort. Når et område er karteret, tegnes grænserne mellem de forskellige jordarter ind på kortet. Det digitale kort er fremstillet ud fra rentegnede kort med henblik på anvendelse og opdatering via et GIS, således at digitale geografiske analyser og beregninger nu er mulige. Kortet har mange anvendelsesmuligheder indenfor landbrug, skovbrug, miljøplanlægning og forskning. Kortet benævnes ”Danmarks Digitale Jordartskort 1:25.000” eller blot ”Jordartskort 1:25.000”

Ca. 85 % af Danmarks areal er dækket af denne kortlægning. Dog er der også fremstillet et landsdækkende kort med en lavere detaljeringsgrad, hvor jordarterne i de ikke-karterede områder er skønnet ud fra boringsoplysninger og generel viden om geologi. Dette kort, der også foreligger digitalt, benævnes ”Danmarks Digitale Jordartskort 1:200.000” eller blot ”Jordartskort 1:200.000”.

Ved anvendelse af jordartskortet som GIS-register, f.eks. til tildeling af jordartstyper til adressepunkter, er det således nødvendigt at anvende Jordartskort 1:200.000 i de områder, der endnu ikke er dækket af Jordartskort 1:25.000.

3.2.7 GEUS’s Jupiter database

Jupiter databasen samler GEUS's data vedrørende vandforsyning og drikkevand. De primære enheder i databasen er boring, pejling, grundvandsprøve, indvindingsanlæg og drikkevandsprøve - men langt flere detaljer findes i databasen. Den enkelte boring og det enkelte anlæg er forsynet med oplysninger om kommunenummer og evt. postnummer og matrikelnummer. Den primære metode til at knytte disse enheder sammen med andre registre vil være at anvende de registrerede koordinater i en koordinat-baseret GIS-sammenkøring.

Til det aktuelle projekt er vi specielt interesseret i databasens oplysninger om drikkevandskvalitet. Mens analyser af det ubehandlede vand normalt vil være knyttet til den enkelte boring, hvorfra vandprøven er taget, vil analyser af det rensede drikkevand være knyttet til et indvindingsanlæg (vandværk), der ofte vil få vand fra flere boringer. Når det drejer sig om vand fra små enkeltvandforsyningsanlæg, der normalt kun har en enkelt boring, vil der alligevel blive oprettet et anlæg i databasen. Drikkevandsprøver taget fra en vandhane på adressen vil blive knyttet til dette ét-borings-anlæg og ikke til selve boringen.

3.2.8 Cancerregistret

Cancerregisteret er oprettet for at etablere en landsdækkende registrering af alle nydiagnosticerede cancertilfælde og andre anmeldelsespligtige sygdomme i Danmark. Det danske Cancerregister blev oprettet i 1942 af Kræftens Bekæmpelse med støtte fra Sundhedsstyrelsen og Den Almindelige Danske Lægeforening. Formålet er at indsamle og opbevare oplysninger til brug ved udarbejdelse af statistik vedrørende cancersygdomme - og andre anmeldelsespligtige sygdommes forekomst, forskning i disse sygdommes årsager og forløb og en nærmere analyse af cancermønsteret og af andre anmeldelsespligtige sygdommes forekomst blandt andet med henblik på planlægning i sundhedsvæsnet.

Cancerregisteret indeholder cancertilfælde og anmeldelsespligtige sygdomme i Danmark siden 1943. Indberetning skete på frivillig basis frem til marts 1987, hvorefter det blev obligatorisk ifølge en bekendtgørelse fra Sundhedsstyrelsen af 15. januar 1987. Cancerregisteret blev den 1. januar 1997 overflyttet fra Kræftens Bekæmpelse til Sundhedsstyrelsen.

I Cancerregisteret registreres diagnosetidspunktet for den anmeldelsespligtige sygdom, og hvor den anmeldelsespligtige sygdom er placeret samt, hvilken type det er. Desuden registreres udbredelse af sygdommen i relation til diagnosetidspunktet inden for de første fire måneder - samt hvordan diagnosen er stillet.

3.2.9 Landspatientregistret

Landspatientregisteret indeholder oplysninger om alle kontakter til de danske sygehuse. Det gælder indlæggelser, deldøgn, ambulante og på skadestuer. Landspatientregisteret indeholder bl.a. oplysninger om; sygehus og afdeling, indlæggelses- og udskrivningsdato, diagnoser, operationer og bopælskommune.

For indlæggelser går registeret tilbage til 1977. Skadestue og ambulante kontakter er registreret siden 1995. Landspatientregisteret giver mulighed for dels at følge aktiviteten på de enkelte sygehuse, dels at opgøre det samlede forbrug af sygehusydelser (for amter og kommuner). Herudover bidrager Landspatientregisteret til Sundhedsstyrelsens sundhedsovervågning og til den medicinske forskning.

Reglerne for indberetning af data til Landspatientregisteret fastlægges af "Koordinationsgruppen for individbaseret patientregistrering". Gruppens medlemmer er udpeget af de enkelte amter, som hver har en repræsentant. Desuden har H:S (Hovedstadens Sygehusfællesskab), Demografisk Institut i Århus, Amtsrådsforeningen, Indenrigs- og Sundhedsministeriet og Sundhedsstyrelsen repræsentanter i gruppen. Reglerne for indberetning er beskrevet i "Fællesindhold for basisregistrering af sygehuspatienter", der udkommer en gang årligt.

3.2.10 Misdannelsesregistret

Misdannelsesregisteret danner grundlag dels for Sundhedsstyrelsens overvågning af hyppigheden af medfødte misdannelser og sene spontane aborter, og dels for Sundhedsstyrelsens løbende statistik på området. Herudover bidrager registeret med data til den medicinske forskning. Misdannelsesregisteret indeholder oplysninger fra og med 1983.

Misdannelsesregisteret indeholder oplysninger om, hvorvidt der er tale om en levendefødt, dødfødt eller sen abort. Herudover indeholder misdannelsesregisteret oplysninger om fødsel, forældre, misdannelsestype og kromosom-anormali. Datagrundlaget for Misdannelsesregisteret var i perioden 1983 til 1994 baseret på skemaindberetning til Sundhedsstyrelsen. Fra 1995 er indberetningen sket elektronisk via Landspatientregisteret.

3.2.11 Fødselsregistret

Fødselsregisteret rummer oplysninger om alle fødsler (hospitals of hjemmefødsler). Registeret bruges til at beskrive fødsler i Danmark som en af de centrale, nationale sundhedsindikatorer. Herudover bidrager registeret med data til medicinsk forskning.

Fødselsregisteret indeholder oplysninger fra og med 1973. Registeret indeholder oplysninger om selve fødslen, resultat af fødslen, og om der har været komplikationer i fødselsforløbet. Datagrundlaget for Fødselsregisteret var i perioden 1973 til 1995 baseret på skemaindberetning til Sundhedsstyrelsen. Fra 1995 er indberetningen om fødsler på hospital sket elektronisk via Landspatientregisteret. Endvidere indgår udtræk fra CPR, det centrale personregister, og skema-indberetninger om hjemme- og dødfødsler i registeret.

3.3 Statistisk metode

3.3.1 Cancer data

For hver person, der har boet i undersøgelsesområdet, registreres CPR nummer, bopælsadresse, vandforsyning, kommune, jordtype til- og fraflytningsdato samt evt. cancerdiagnose og dato for første diagnose. Hvis en person har mere end en cancerdiagnose medtages kun den første. Fraflytning er dato for evt. fraflytning eller undersøgelsens sluttidspunkt (31.12.2003). Tilflytningsdato defineres som den seneste af følgende datoer fødselsdato; tilflytningsdato eller dato for start af registrering (1.1. 1986).

Først oprenses data og derefter defineres en eksponeringsvariabel, der er en nul-et variabel, der definerer om en person bor på almen eller enkeltvandforsyning. Der optælles ”person-år”, dvs. antal år som hver person gennemlever med en bestemt vandforsyning i en bestemt aldersklasse. Alder kategoriseres i 4 års intervaller. Ved analyserne af jordbundstype medtages kun de personer, hvor der er oplysning om jordbundstype.

Spørgsmålet der ønskes bevaret er, om personer, der bor på en adresse med enkeltvandforsyning hyppigere får cancer end personer med almen vandforsyning. Derfor anvendes Poisson regression, der sammenligner forholdet mellem antal cases og gennemlevet risikotid imellem de to eksponeringsgrupper.I analyserne tages der højde for alder, da risikoen for at få cancer øges med alderen. Hvis aldersfordelingen er forskellig blandt personer med enkeltvand- og almen vandforsyning, kan det være en konfounder. Desuden findes oplysningen om jordtypen på adressen (lerjord, sand/gruset eller ukendt) og effekten af jordtype undersøges derfor også. For en uddybende gennemgang henvises til bilag 1 og 2.

3.3.2 Misdannelsesdata

I datasættet findes oplysninger om, hvorvidt barnet er født med kryptorkisme eller hypospadi, barnets fødselsvægt, moderens adresse ved fødslen og i graviditeten (dvs. 270 dage før fødslen) og vandforsyningen på adressen. Hvis moderen er flyttet i graviditeten defineres hendes eksponeringsstatus ud fra vandforsyningen tidligt i graviditeten. En efterfølgende sensitivitetsanalyse blev foretaget, der blev eksponeringsstatus i stedet bestemt ud fra vandforsyningsstatus ved fødslen.

Den eksponering, der ønskes undersøgt, er hvorvidt moderen har boet ved enkeltvand- eller almen vandforsyning i graviditeten. Derfor foretages logistisk regression med kryptorkisme eller hypospadi som outcome og vandforsyning som forklarende variabel. I modellen inkluderes også fødselsvægt. Desuden findes oplysningen om jordtypen på adressen (lerjord, sand/gruset eller ukendt) og effekten af jordtype undersøges derfor også.

I logistisk regression forudsættes, at de studerede hændelser er uafhængige, hvilket måske ikke helt er opfyldt i disse analyser, hvor den samme kvinde kan have flere fødsler og flere drenge med misdannelser. Det kan tænkes at risikoen for at få et misdannet barn er større hos mødre, der allerede har fået et misdannet barn, og derfor er udfaldene mellem brødre ikke uafhængige. Analysen gentages derfor, hvor kun det førstefødte barn medtages for hver kvinde. For en uddybende gennemgang af den statistiske analyse henvises til bilag 1 og 2.

 



Version 1.0 Oktober 2007, © Miljøstyrelsen.