Har fluorid i drikkevand en betydning for caries hos børn ?

2 Materialer

Projektet anvender data fra følgende registre: CPR-registret, Sundhedsstyrelsens Centrale Odontologiske Register (SCOR), Bygnings- og Boligregistret (BBR), De Officielle Standard Adresser og Koordinater (OSAK), Danmarks og Grønlands Geologiske Undersøgelses Jupiter database samt indkomstdata fra SKAT (se bilag A). I de følgende afsnit gives beskrivelse af de generelle regler for registersamkøringsprojekter og beskrivelser af de enkelte registre der indgår i projektet.

2.1 Regler

2.1.1 Personfølsomme data

Behandling af personfølsomme registre er i Danmark reguleret i ’Lov om behandling af personoplysninger, LOV nr. 429 af 31/05/2000’ og de senere ændringer til loven. Lovens populærtitel er Persondataloven og yderligere oplysninger kan findes via Retsinformation på www.retsinfo.dk. Tilladelse til behandling af personfølsomme data gives ud fra en vurdering af at Persondatalovens bestemmelser overholdes. Det er Datatilsynet der giver tilladelse til projekter der indbefatter personfølsomme oplysninger. For yderligere oplysninger om Datatilsynet, samt information om ansøgningsprocedurer mv. henvises til Datatilsynets hjemmeside på www.datatilsynet.dk.

Idet nærværende projekt indeholdt personfølsomme data, både med hensyn til CPR-registret, tandstatus og husstandsindkomst søgte projektet Datatilsynet om tilladelse til behandling af de pågældende data. Datatilsynet har været særdeles behjælpeligt i forbindelse med behandlingen af ansøgningen og fremstår som en statslig institution med et meget højt serviceniveau.

Når Datatilsynets tilladelse har foreligget, har der ikke været problemer med at få udleveret personfølsomme data til projektet fra de enkelte dataejere.

2.1.2 Ikke personfølsomme data

Regulering af ikke personfølsomme data foregår ud fra de enkelte dataholderes interne regler. I nærværende projekt har der ikke været problemer med anskaffelse af denne type data.

2.2 CPR-registret

2.2.1 Generelt

CPR-registret blev oprettet den 2. april 1968, hvorefter alle personer med fast bopæl i Danmark har fået tildelt et personnummer. CPR-registret administreres af CPR-kontoret i Indenrigs- og Sundhedsministeriets departement. CPR-kontoret fungerer som central leverandør af basale personoplysninger til offentlige myndigheder og den private sektor. Oplysninger vedrørende kontaktoplysninger og regler mv. i forbindelse med dataudtræk kan ses på CPR-kontorets hjemmeside på www.cpr.dk. CPR-systemet er reguleret af Lov om Det Centrale Personregister (CPR-loven), jf. lovbekendtgørelse nr. 140 af 3. marts 2004. Den egentlige lovtekst kan findes via Retsinformation på www.retsinfo.dk.

Udover personer med fast bopæl i Danmark er det ligeledes muligt at have et CPR-nummer i de tilfælde, hvor der er en administrativ begrundelse herfor. Dette kan f.eks. være af skatte- eller pensionshensyn eller i forbindelse med udenlandske personers deltagelse som hovedperson i en kirkelig vielse i Danmark. CPR-numre, der tildeles personer, der er bosiddende udenfor Danmark, betegnes som administrative CPR-numre, og disse tildeles specielle koder, så de kan adskilles fra almindelige CPR-numre.

CPR-nummeret består af en 10 cifret kode, der opbygges på følgende måde: Fødselsdag (01-31), fødselsmåned (01-12), fødselsår (00-99), løbenummer (3 cifre) og kontrolciffer (0-9). Kontrolcifferet anvendes dels til kodning for køn (ulige = mand, lige = kvinde) dels til kontrol af CPR-nummeret vha. modulus-11. Kombinationen af løbenummer og fødselsår anvendes ligeledes til bestemmelse af fødselsårhundrede. Når en person er blevet tildelt et CPR-nummer, følger det pågældende CPR-nummer personen for resten af livet. CPR-nummeret kan alene ændres, såfremt det kan dokumenteres, at der er uoverensstemmelse mellem ens faktiske fødselsdato og/eller køn og de tilsvarende oplysninger i CPR-nummeret.

CPR-registret indeholder oplysninger om personlige forhold, herunder bl.a.: CPR-nummer, Navn, Fødselsdato, Adresse, Tilflytning, Fødested, Status (herboende/udvandret/forsvundet/død mv.), Ægteskabeligt forhold (gift/ugift/fraskilt/enke), Ægtefælle og Forældre. For registrering af status og ægteskabeligt forhold registreres ligeledes begyndelsesdato. CPR-registret opdateres løbende i forbindelse med opdatering af personoplysninger i folkeregistrene. Oplysninger der opdateres med nye indberetninger registreres herefter med afslutningsdato og er således ikke gældende længere. Eksempel herpå er f.eks. registrering af bopæl, hvor en flytning resulterer i opdatering af adresseoplysninger, hvorved den tidligere adresse lukkes med fraflytningsdato.

Selvom CPR-registret er oprettet til administrative forhold er det ligeledes muligt at anvende det til forskningsmæssige opgaver. Værdien i forhold til miljømedicinske projekter er især oplysningerne omkring nuværende og tidligere bopæl, idet det f.eks. i forbindelse med udredning af en given eksponering der knytter sig til en ejendom eller et område ikke er ligegyldigt hvor længe en person har været udsat for den pågældende eksponering.

I nærværende projekt er oplysningerne omkring nuværende og tidligere bopæl anvendt med henblik på estimering af den fluorid-påvirkning hver enkelt person i undersøgelsespopulationerne har været udsat for. Ligeledes er bopælsoplysningerne anvendt til at opdele populationerne i grupper med forskellig sikkerhed for kvaliteten af den estimerede eksponering, samt inddeling i forhold til de forskellige fluoridniveauer i landets vandværker. Endelig er oplysninger vedrørende familieforhold anvendt, idet CPR-registrets forældre-oplysninger er anvendt i forbindelse med identifikation af husstandsindkomst for undersøgelsespopulationen.

2.2.2 Anskaffelse

Anskaffelse af et udtræk af CPR-registret til forskningsformål sker ved henvendelse til CPR-kontoret. CPR-kontoret forestår sagsbehandlingen i forbindelse med godkendelse af projekt mv. CPR-kontoret er vant til denne type af henvendelser, hvorfor sagsgangen opleves som ukompliceret og hurtig. Generering af dataudtrækket foretages af en datadistributør, der ved programmering tager ca. 1000 kr. i timen, og det er oplyst, at der kan forventes et minimumsforbrug på ca. 30 timer. I stedet er det muligt at udvælge et udtræk, der matcher en eller flere af de standardudtræk, som CPR-kontoret har defineret, hvorved prisen kan reduceres drastisk. For et udtræk, der indeholder data fra efter 1986, kan et totalt udtræk erhverves for nogle få tusinde kroner, mens udtræk, der derudover indeholder data fra før 1986, koster lidt mere, ca. 10.000 kr.

2.2.3 Databehandling

For at få data på en form så det er muligt at arbejde videre med dem, har projektet anvendt en professionel programmør til at lægge data i en database. Datasæt i denne størrelse kan ikke lægges i en MS Access database, da der er en databasebegrænsning på Access databaser på 2 Gb. Derfor lagde programmøren data i et professionelt databaseværktøj, MS SQL Server, med henblik på videre databehandling. En licens til MS SQL Server varierer meget i pris, det anbefales at tage kontakt til en softwareleverandør for at få den aktuelt gældende pris.

Fra SQL serveren er det muligt ved hjælp af simple sql-kommandoer at generere udtræk der indeholder netop de personer og variable der behandles i projektet. Data kan trækkes ud til mange typer af filer, hvorved det er muligt at arbejde videre med data i netop det softwaremiljø som man er bekendt med. Ligeledes er det muligt at lade data blive i SQL serveren og anvende den til registersamkøringen. I dette projekt er data trukket ud til et format, der kan læses af ArcGIS, idet GIS programmet senere skulle anvendes til databehandling af rumlige data.

2.3 SCOR-registret

2.3.1 Generelt

Sundhedsstyrelsens Centrale Odontologiske Register (SCOR) blev etableret i forbindelse med vedtagelse af Lov om Børnetandpleje (Lov nr. 217 af 19. maj 1971) med det formål, at de kommunale myndigheder såvel som Sundhedsstyrelsen kunne overvåge forekomsten af tandsygdomme hos danske børn og unge (Helm, 1973). For de lokale myndigheder, herunder tandplejens ledelse, har systemet haft stor betydning i forbindelse med planlægning og evaluering af den kommunale børne- og ungdomstandpleje (Hansen, 1998, Hansen et al., 2001). Derudover har SCOR dannet grundlag for rapporter fra Sundhedsstyrelsen (Poulsen & Pedersen, 2002, Sundhedsstyrelsen 1985, 2004), og har været anvendt i en lang række forskningsprojekter (Heidmann, 1985, Parner et al., 2001, 2002, Poulsen et al., 2001).

SCOR blev implementeret trinvist på samme måde som den kommunale børne- og ungdomstandpleje. Indtil 1993 var det obligatorisk for kommunerne at indberette alle børn, der var omfattet af den kommunale tandpleje. Fra 1993 reduceredes de obligatoriske indberetninger til at omfatte 5-, 7-, 12- og 15-årige. Reduktionen af de obligatoriske indberetninger blev besluttet af Sundhedsstyrelsen på grundlag af et besparelseskrav. De obligatoriske indberetningstidspunkter er valgt ud fra odontologiske kriterier. En del kommuner (ca. halvdelen) indberetter dog flere – ofte udvalgte – årgange, end de obligatoriske. Der er det samme krav om indberetning i de kommuner, hvor børne- og ungdomstandplejen foregår på kommunale tandklinikker, som i de kommuner, hvor den foregår på private tandklinikker.

SCOR har undergået en række revisioner i årenes løb. Disse er dog foretaget med skyldigt hensyn til ønsket om at sikre kontinuitet i systemet. Den seneste revision samt vejledning i brugen af systemet gældende fra 1/1 2000 findes i en rapport fra Sundhedsstyrelsen fra 1999 (Sundhedsstyrelsen, 1999).

Dataindsamlingen foregår på den enkelte tandklinik i forbindelse med de regelmæssige undersøgelser af tandlæge eller tandplejer, og der indberettes én gang årligt. Som baggrundsoplysninger registreres CPR-nummer, kommunenummer og undersøgelsesdato. Derudover er der mulighed for at registrere skolekode, klassetrin og (i kommuner, hvor tandplejen foregår på private klinikker) den privatpraktiserende tandlæges sygesikringsydernummer. Registreringerne af de kliniske forhold omfatter følgende:

  • Tilstedeværende tænder (tandstatus)
  • Caries og caries-følgetilstande (dvs. fyldninger og ekstraktioner)
  • Skader efter akutte mekaniske traumer
  • Gingivitis (”tandkødsbetændelse”) og marginal parodontitis (”parodontose”) på 12 udvalgte tænder. Registrering af gingivitis er ikke obligatorisk, og registrering af marginal parodontitis er kun obligatorisk for 12- og 15-årige
  • Tandstillingsfejl

For hvert af de ovenfor nævnte kliniske forhold findes der relativt præcist beskrevne kriterier. Der er dog næppe nogen tvivl om, at der kan være forholdsvis store inter-undersøger variationer i fortolkningen af de beskrevne kriterier. En række kommunale børne- og ungdomstandplejer har derfor arbejdet med kalibrering (Klausen & Sander, 2001).

Fundene fra de kliniske undersøgelser noteres på en OCR-blanket (Optical Character Recognition) (Figur 2).

Figur 2 OCR-blanket, der anvendes til indberetning til SCOR.

Figur 2 OCR-blanket, der anvendes til indberetning til SCOR.

Alder beregnes som statusår minus fødselsår (f.eks. er et barn som er født i 1999 og undersøgt i 2004 defineret som 5-årig (2004-1999 = 5 år). OCR-blanketten indsendes fra de kommunale tandplejer til IBM Danmark A/S, Bytoften 1, 8240 Risskov. Her indlæses data, ”afluses” og lagres mhp. på senere analyse. Data fra de enkelte indberetningsår ligger lagret separat, således at det ikke umiddelbart er muligt at udføre individ-baserede longitudinelle analyser. Hen imod kalenderårets slutning melder IBM en deadline for indberetning i det pågældende kalenderår ud til de kommunale tandplejer, og ved slutningen af januar måned (ofte omkring d. 20. januar) modtager hver kommunal tandpleje et tabelsæt. Derudover modtager Sundhedsstyrelsen en national total, der lægges ud på Sundhedsstyrelsens hjemmeside. Det tabelsæt, de kommunale tandplejer modtager, indeholder 9 standardtabeller. Derudover er der mulighed for at rekvirere en række specielle kørsler, hvilket dog ikke sker særlig ofte.

Der findes i øvrigt en brugerhåndbog, som i detaljer beskriver systemet (Sundhedsstyrelsen, 1988).

2.3.2 Anskaffelse

Indledningsvist anmodedes i e-mail af 8. juni 2005 med vedhæftet projektbeskrivelse Sundhedsstyrelsens afdelingstandlæge om tilladelse til at få foretaget et udtræk af SCOR af data for alle 5- og 15-årige i 1994 og 2004. Sundhedsstyrelsen anmodede herefter som dataansvarlig Datatilsynet om tilladelse til videregivelse af data, og i brev af 1. august meddelte Sundhedsstyrelsen, at Datatilsynet havde givet tilladelse til at indhente de ønskede data. Det tog således næsten 2 måneder fra vor anmodning til Sundhedsstyrelsen til vi fik godkendelsen. Dette skyldes angiveligt, ”et mindre problem forårsaget af, at sagsnummeret var relateret til embedslægerne”, samt at ansøgningen blev behandlet henover en ferieperiode.

Projektet rettede herefter henvendelse til IBM A/S, Risskov, der leverede de ønskede data 9. august 2005 i det format, der er vist i bilag B. Prisen for dette var 6.715 kr. Bilag C giver en uddybende beskrivelse af datasættet. Dette format var ikke umiddelbart tilgængeligt for standard statistikprogrammer, hvorfor det blev konverteret til STATA af en programmør. Det kostede 10.000 kr. Det endelige datasæt var klart til analyserne ultimo august 2005.

2.4 BBR-registret

2.4.1 Generelt

Bygnings- og boligregistret (BBR) er et landsdækkende register, der blev oprettet i 1976, som indeholder oplysninger om bygnings- og boligforhold. Registret omfatter udover den almindelige boligmasse ligeledes oplysninger om specielle bygninger, som f.eks. kirker, hospitaler og slotte mv. Registret anvendes både af statslige, amtskommunale og kommunale myndigheder samt af forsyningsselskaber og private virksomheder, som f.eks. ejendomsmæglere, realkreditinstitutter mv. De fleste oplysninger i BBR er gratis og offentligt tilgængelige via den Offentlige Informations Server (www.ois.dk). I forbindelse med masseudtræk, som f.eks. til registersamkøringsprojekter, er det dog nødvendigt at anskaffe udtrækket via en godkendt OIS-datadistributør. En liste over godkendte distributører kan ligeledes findes på www.ois.dk. Det skal bemærkes, at distributørerne opererer med forskellige priser, hvorfor det kan anbefales at kontakte flere forskellige med henblik på en forhandling om udgifterne til dataudtræk fra OIS.

Det er BBR der ligger til grund for beregning af ejendomsvurderingerne, ligesom forsyningsselskaberne anvender BBR i forbindelse med planlægnings- og analyseopgaver og ved fastsættelse af afgifter. Det er Erhvervs- og Byggestyrelsen der har dataansvaret for BBR, men det er kommunernes opgave at ajourføre, opdatere og vedligeholde data. Registret opdateres løbende via kommunernes inddatering af data bl.a. i forbindelse med byggesagsbehandling. Den enkelte ejer er forpligtet til at rette henvendelse til kommunen såfremt det konstateres, at der er ukorrekte data i BBR. BBR opdateres 5 gange ugentligt og afspejler således de aktuelle forhold i ejendomsmassen i Danmark for så vidt at de indberettede oplysninger er korrekte.

BBR indeholder ikke historiske oplysninger, idet opdateringer i registret erstatter tidligere inddateringer. Dette er fra en miljø- og sundhedsforskningsmæssig tilgangsvinkel uheldigt, idet det derved ikke er muligt fuldt ud at anvende de historiske oplysninger i CPR-registret. Netop dette problem er aktuelt i nærværende projekt, idet adresser, der er registreret i BBR tilhørende en almen vandforsyning, få dage inden dataudtrækket kan have været forsynet fra en privat brønd. Herved vil der opstå fejl i eksponeringen, idet brønde og almene vandværker sjældent indvinder vand fra samme grundvandsmagasin, og dermed kan drikkevandets karakteristika være ændret væsentligt.

BBR er opbygget i tre niveauer, hhv. Ejendom, Bygning og Enhed. Inddelingen skyldes at nogle oplysninger henviser til hele ejendommen, der kan bestå af flere bygninger, hvoraf nogle bygninger kan bestå af flere enheder. Et eksempel herpå kan være en ejendom, der består af en matrikel med bebyggelse på. Bebyggelsen kan være opdelt i en ejendom og nogle garageanlæg. Ejendommen kan inddeles mellem nogle enheder, f.eks. et erhvervslejemål, og en del der er indrettet til beboelse.

2.4.2 Anskaffelse

Anskaffelse af et udtræk af data fra BBR kan foretages af en af de OIS godkendte data-distributører. Nærværende projekt rettede henvendelse til to distributører, idet der var interesse i at finde ud af, om der var harmoniseret prisdannelse på området. De to forskellige distributører kunne levere et landsdækkende udtræk af BBR til hhv. 80.000 og 50.000 kr. Projektgruppen valgte den billige løsning, idet den yderligere indeholdt et udtræk af OIS’ adressedata til den samme pris. For beskrivelse af adressedata se nedenstående afsnit (OSAK adresserne).

2.4.3 Databehandling

Databehandling af dataudtræk af den størrelse som CPR, BBR og OSAK kræver stor erfaring, idet mindre fejl kan være svære at opdage, selvom de har omfattende konsekvenser. Derfor valgte projektgruppen at benytte en ekstern konsulent til håndtering af de rå data. Konsulenten importerede alle tre registre fra rå data og lagde data i en database, hvorefter data kunne udtrækkes til brug for projektet herfra. Generering af udtræk fra databasen kan specificeres ud fra udvælgelseskriterier, der henviser til værdier i de enkelte kolonner.

2.5 OSAK adresserne

2.5.1 Generelt

OSAK står for Officielle Standard Adresser og Koordinater. OSAK adresserne ligger ligesom BBR på www.ois.dk, og formålet med OSAK er at sørge for at man ét sted kan finde et adressedatasæt, som de enkelte kommuner har fastsat. OSAK er genereret som foreningsmængden af adresser registreret i BBR og KRR (Kryds Reference Registret). Hver enkelt adresse i OSAK er forsynet med koordinater, der refererer til det internationale koordinatsystem UTM/ETRS89 og OSAK opdateres ca. en gang om måneden.

OSAK indeholder i alt ca. 2,2 mio. adressepunkter med tilhørende koordinater. Koordinaterne repræsenterer husnumre og ikke boenheder, således vil etageejendomme alene have tilknyttet én koordinat, svarende til én gadedør. Udover koordinater er hvert enkelt adressepunkt refereret til Det Danske Kvadratnet, et standardiseret netværk (grid) dækkende hele Danmark. Kvadratnettet er opdelt i 5 maskestørrelser, hvoraf OSAK refererer til tre, med maskestørrelsen på hhv. 100 meter, 1 km og 10 km. Denne reference kan anvendes i de tilfælde, hvor det ikke har været muligt at tilknytte koordinater til en adresse, hvorved det er muligt at angive en omtrentlig placering af adressen.

2.5.2 Anskaffelse

OSAK adresserne var indeholdt i udtrækket fra BBR.

2.5.3 Databehandling

OSAK adresserne ligger i BBR med færdigbearbejdet adressekode, sammensat af kommunekode, vejkode og husnummer.

2.6 Jupiter databasen

2.6.1 Generelt

Jupiter databasen, samler GEUS's data vedrørende boringer og drikkevand. De primære enheder i databasen er boring, pejling, grundvandsprøve, indvindingsanlæg og drikkevandsprøve, men langt flere detaljer findes i databasen. Til det aktuelle projekt er det oplysningerne vedrørende indvindingsanlæg og de dertil hørende drikkevandsprøver og indvindings-mængder, der anvendes. Strukturen i de anvendte tabeller er vist på Figur 3.

figur 3 Struktur for anvendt del af Jupiter databasen

figur 3 Struktur for anvendt del af Jupiter databasen

Det ses af figuren, at termen "prøve" anvendes om en given prøvetagning af vand. Denne prøve analyseres for et antal stoffer og hver af disse stof-analyser lagres i "analyse", der altså kun rummer et enkelt analyseresultat fra et enkelt stof. Desuden kan der være mange boringer knyttet til et enkelt vandværk.

De primære nøgler i Jupiter databasen er boringsnummeret (kaldet DGU-nummer) og anlægsnummeret, men i og med at både boringer og anlæg normalt vil være forsynet med koordinater, vil oplysningerne kunne samkøres med andre databaser gennem en oversættelse af koordinaten til et adressepunkt, matrikelnummer m.m. Disse kan også være eksplicit angivet i databasen, men ofte vil samkøringen ske via en GIS-baseret koordinat-kobling.

I de papirarkiver, der var forløberen for Jupiter-databasen, er der blevet indberettet boringsdata siden 1926, hvor det blev gjort lovpligtigt. Data vedrørende vandindvinding og drikkevandskvalitet er blevet indberettet fra amterne siden ca. 1985. Amterne har samlet data fra de enkelte kommuner (der er tilsynsmyndighed) og har foretaget en årlig indberetning til GEUS. I de senere år er der blevet indført en række automatiske kvalitetskontrol-rutiner, som har sikret en større kvalitet i de data, der fyldes i den centrale Jupiter-database.

2.6.2 Anskaffelse

Da GEUS har deltaget i projektet blev dataudtræk og databearbejdning foretaget af projektgruppen. Ellers ville det have krævet en henvendelse til GEUS med beskrivelse af det ønskede udtræk og en betaling på timebasis for den tid, der blev brugt på at fremstille det.

2.6.3 Databehandling

Den primære samkøring i dette projekt er mellem data vedrørende cariesforekomst og data vedrørende fluoridindhold i drikkevand. Cariesforekomst er knyttet til CPR-numre, som via CPR-registret kan kobles til adresser, og disse kan igen transformeres til adresse-koordinater via OSAK (De Officielle Standard Adresser og Koordinater). Fluoridanalyser er knyttet til et vandværk, og GEUS's Jupiter database har også koordinater for vandværkets fysiske placering. Problemet er så, at der p.t. ikke eksisterer en landsdækkende database eller digitalt kort, der kan knytte en forbindelse mellem et vandværk og de adresser, der forsynes med vand fra dette vandværk.

De enkelte vandværker og vandforsyningsselskaber har selvfølgelig viden om hvilke adresser, de forsyner. Denne viden vil findes på en eller flere af følgende former:

?     Et kort over forsyningsområdet på analog eller digital form

?     En database med oplysninger (herunder adresse) på de kunder, der skal betale for vandleverance

?     En registrering af ledningsnettets opbygning på digital form

Men hvis man skal arbejde med landsdækkende data, vil det være en uoverkommelig opgave at indsamle disse oplysninger fra flere tusind vandværker.

Når der ikke allerede er etableret en landsdækkende database eller digitalt kortværk over forsyningsområderne, hænger det sandsynligvis sammen med, at datasammenhængen kan være temmelig kompliceret. I større byers vandforsyninger kan der indgå flere vandværker, hvis vand kan sammenblandes i vandtårne, højdebeholdere o. lign. inden levering til forbrugeren. Der kan også foregå import og eksport af vand mellem vandværker. I dette projekt beskæftiger vi os kun med kvaliteten af drikkevandet ved afgang fra vandværk, men hvis man ønskede at identificere hvilke konkrete boringer og hvilke grundvandsmagasiner en given forbrugers vand stammer fra, ville sagen blive yderligere kompliceret. Det vil vi dog ikke komme nærmere ind på her.

Det komplicerede billede kan eksemplificeres med Københavns Energi's (KE) vandleverancer. Udover Københavns kommune er der 17 omegnskommuner, der dækker en større eller mindre del af deres vandforbrug med vand fra KE. I disse 17 kommuner befinder sig 12 % af Danmarks indbyggere og husstande. Uden at vi har sikker viden om det, vil vi antage, at den enkelte forbruger ikke på sin vandregning kan se, hvor vandet kommer fra, og at det importerede vand ofte vil blive blandet med kommunens egenindvundne vand.

2.7 SKAT data

2.7.1 Generelt

SKAT har leveret dataudtræk til projektet fra registreringen af indkomst for indkomståret 2004. Registreringen hos SKAT er alene beregnet til skatte-formål og henvendelsen fra nærværende projektgruppe er behandlet som en special-sag i SKAT. Data i SKAT indeholder alle for SKAT relevante oplysninger, hvilket i realiteten vil sige alle oplysninger der forekommer på selvangivelsen og årsopgørelsen. Anvendelse af skatteoplysninger i forskningsprojekter er traditionelt baseret på skatteoplysninger registreret ved Danmarks Statistik, men nærværende projekt valgte at anvende data fra SKAT dels på grund af prissætningen hos Danmarks Statistik og

dels på grund af muligheden for tilknytning af CPR-numre og efterfølgende videre bearbejdning af projektgruppen, hvilket ikke er muligt med Danmarks Statistiks data.

2.7.2 Anskaffelse

Henvendelsen vedrørende anskaffelse af data fra SKAT er behandlet af SKATs kontor for Borgerservice. Derudover er henvendelsen bedømt af SKATs juridiske kontor men henblik på vurdering af det juridiske aspekt af udlevering af personfølsomme data. Ligesom ved de andre personfølsomme registre var en godkendelse af projektet ved Datatilsynet, samt en projektbeskrivelse tilstrækkeligt til at blive godkendt som modtager af data. Prisen for data ligger ikke fast, da SKAT meget sjældent modtager denne type af henvendelse. Derfor vil prisen for et udtræk være baseret på en konkret vurdering af tidsforbruget i forbindelse med sagsbehandling og generering af udtræk. Udtræksfilen er genereret på baggrund af match med en indsendt liste over CPR-numre der indgår i undersøgelsen. Data leveres på cd.

2.7.3 Databehandling

Den genererede udtræksliste af CPR-numre blev defineret som alle CPR-numre, der er bosiddende på den samme adresse, som en person der indgår i undersøgelsen. Den oprindelige mening var at husstandsindkomst skulle defineres som den samlede indkomst af alle personer bosiddende på samme adresse, som en person der indgår i undersøgelsen. Dette viste sig imidlertid uhensigtsmæssigt, idet enkelte adresser havde over 500 beboere på samme adresse, hvorved den samlede husstandsindkomst tydeligvis ikke ville kunne anvendes som proxy for socialstatus. I stedet defineredes husstandsindkomst som den samlede skattepligtige indkomst for personer bosiddende på samme adresse som børnene i undersøgelsen, og som samtidig er registreret som forælder til barnet i CPR-registret.

Definitionen af adresse (bo-enhed) er her udvidet fra definitionen af den normale adressekode i adresseregistret, idet adressekoden er defineret som en administrativ kode, der anvendes til gadedørsniveau, mens den udvidede adressekode udover kommunekode, vejkode og husnummer indeholder etageangivelse og sidedør. Denne udvidede adressekode kan derved anvendes i de tilfælde, hvor der er flere bo-enheder (f.eks. lejligheder) til den enkelte adressekode (gadedør).

 



Version 1.0 December 2007, © Miljøstyrelsen.