Har fluorid i drikkevand en betydning for caries hos børn ?

3 Metoder

Der er foretaget en registerbaseret samkøring af data fra forskellige dataholdere. Data er blevet oprenset for fejl og mangler, idet CPR-registret anvendtes som reference. CPR-registret blev anvendt som reference, da disse data anses for meget fuldstændige med hensyn til registrering af enkeltpersoner. I forbindelse med samkøring af data ville alene data for personer (CPR-numre) der ikke var registreret i CPR-registret dermed udgå af undersøgelsen. Data, hvor der ikke kunne matches f.eks. fra SCOR-registret, eller hvor der var ufuldstændige oplysninger om f.eks. bopæl i CPR-registret, registreredes i de samkørte data med specielle koder, således at det var muligt at analysere bortfaldet opdelt på forskellige typer af matchnings-fejl.

3.1 Anvendelse af GIS ved registersamkøringer

Det er enklest at foretage registersamkøringer på basis af nøglefelter som f.eks. CPR-nummer, adressekode, matrikelnummer, kommunenummer - men nogle gange er der ikke mulighed for det. I disse tilfælde kan man ofte skabe forbindelsen vha. GIS (Geografiske Informations Systemer). Traditionelt vil GIS blive opfattet som et system til kortfremstilling. Men en mindst lige så vigtig egenskab ved GIS er muligheden for at foretage beregninger med et geografisk eller stedmæssigt indhold. Mange fænomener vil have et stedmæssigt aspekt, som ved hjælp af disse beregningsmuligheder kan resultere i en sammenkobling. Hvis man f.eks. kender koordinaterne til en vandboring vil man kunne beregne i hvilken kommune eller på hvilket matrikelnummer den ligger - eller hvilket adressepunkt der er nærmest, og hvor langt der er hen til det.

Men også GIS-systemernes visuelle side – kortfremstillingen – kan være nyttig i arbejdet med registersamkøring. Visning af resultater på kortform kan være effektivt til kvalitetskontrol, til at opdage nye sammenhænge – og til præsentation af resultaterne i sidste ende.

3.2 Afgrænsning

Projektet samkører data der henviser til personer født i årene 1979, 1989 og 1999. For disse tre årgange samkøres data vedrørende tandstatus ved hhv. 5 og 15 års alderen som illustreret i nedenstående Tabel 1, idet indberetning af tandstatus i disse aldersgrupper er obligatorisk.

Tabel 1 undersøgelsespopulation defineret ved fødselsår

  1979 1989 1999
Tandstatus v. 5 års alder   X X
Tandstatus v. 15 års alder X X  

Samkøringen af data begrænser sig til adresser med vandforsyning fra almene vandværker. Denne afgrænsning er foretaget, idet oplysninger om fluorid i drikkevandsboringer er meget sporadiske for private boringer eller brønde. Opdelingen mellem vandforsyninger på de enkelte adresser er foretaget ud fra BBR registret, hvori der forefindes oplysninger om enkeltejendommes vandforsyningsforhold.

3.3 SCOR

I undersøgelsen anvendes en række forskellige cariesindices som er beskrevet i Tabel 2.

Tabel 2 Beskrivelse af de i undersøgelsen anvendte cariesindices

Cariesindeks Betydning SCOR-koder
DMFS Antal permanente tandflader (alle tænder) med ”carieserfaring”, hvorved forstås såvel behandlede (dvs. fyldte eller ekstraherede) som ubehandlede cariesangreb 1,2,4,5,6
dmfs, alle primære tænder Antal primære tandflader (alle tænder) med ”carieserfaring”, hvorved forstås såvel behandlede (dvs. fyldte eller ekstraherede) som ubehandlede cariesangreb 1,2,4,5,6

For de aldersklasser, vi har analyseret, har Sundhedsstyrelsen defineret et cut-off punkt for 5-årige på 4 dmfs, i sin beskrivelse af de operationelle tandsundhedsmål, der skulle være opfyldt i 2005 (Sundhedsstyrelsen 1985). For de øvrige aldersklasser har vi selv defineret et cut-off punkt ud fra fordelingerne.

Tabel 3 Cut-off punkter for variable

Variabel Cut-off punkt
dmfs = 5
DMFS = 6

3.4 Jupiter databasen

Som tidligere beskrevet eksisterer der p.t. ikke en landsdækkende database eller et digitalt kort, der kan knytte en forbindelse mellem et vandværk og de adresser, der forsynes med vand fra et vandværk.

Da vi i projektgruppen ønskede at foretage den faglige analyse af sammenhængen mellem caries og fluorid på trods af denne mangel, har vi forsøgt at benytte en alternativ metode til at sammenkoble registrene.

3.4.1 Udvælgelse og kvalitetskontrol af data

Der foretages en udvælgelse af data til dette projekt. Nogle kriterier giver sig selv ud fra projektets formål - andre er blevet føjet til for at sikre en bedre datakvalitet. Problemer med dårlig datakvalitet er altså til dels løst ved at udelukke nogle data fra analysen. Men der er dog også foretaget rettelser i databasen som resultat af den manuelle kontrol.

3.4.1.1 Anlægstype

Databasen indeholder data fra alle typer indvindingsanlæg: vandværker, markvandingsanlæg, industrianlæg, gartnerivanding, bortledning af vand m.m. Til det aktuelle formål er det kun data fra anlæg, der er klassificeret som "Offentligt fællesanlæg", "Privat fællesanlæg" eller "Vandforsyning husholdning, 3-9 husstande", der anvendes. Desuden er vi kun interesseret i analyser for stoffet fluorid. Da de børn, der indgår i undersøgelsen, tidligst er født i 1989, anvendes kun analyser fra 1989 og frem.

3.4.1.2 Afskæring af periode

I de seneste år er proceduren for indberetning af drikkevandsdata fra amterne til GEUS blevet kraftigt automatiseret og forbedret. Der foregår en ret omfattende kvalitetskontrol af data - både som kontrol af den enkelte indberetning og som en sammenligning med tidligere indberettede data fra det samme anlæg. Resultatet er, at datakvaliteten i dag er betydelig bedre end tidligere. Det betyder så også, at der kan sikres en bedre datakvalitet ved at lade de ældste analyser udgå af undersøgelsen. Dette bør dog ikke gøres, hvis netop prøvetagningsåret er af betydning for fluoridværdien. For at undersøge dette, er såvel årsvariationen som den regionale variation i værdierne analyseret - som regioner er her valgt amterne.

3.4.1.3 Boringsdybde og fluorid

I sammenhæng med afskæring af dataperioden blev det i projektgruppen diskuteret, om der kunne påvises en sammenhæng mellem dybden af en indvindingsboring (eller mere præcist det dybdeinterval hvorfra der indvindes vand) og fluoridindholdet. Den eksisterende tendens til at lave dybere indvindingsboringer kunne i så fald bevirke en generel ændring i vandets fluoridindhold.

Denne sammenhæng er blevet undersøgt ved at anvende oplysningerne om hvilke boringer, der er tilknyttet et vandværk – og Jupiter databasens øvrige oplysning om dybde og filtersætning af disse boringer. Til de 3000 anlæg i dataudtrækket er der knyttet ca. 13.000 boringer. Hvis et anlæg har flere boringer tilknyttet sættes ”anlægsdybden” til den dybeste filterbund eller (i mangel af filteroplysninger) største boringsdybde blandt boringerne. Sammenhængen mellem dybde og fluorid kan nu undersøges på landsplan, men da vi jo ved, at der er store regionale forskelle på fluoridindholdet, er sammenhængen også undersøgt i 8 kommuner med mange anlæg – fordelt ud over landet.

3.4.1.4 Skift i anlægs-identifikation

Det er en anden kilde til fejl i databasen, at det identifikationssystem, der benyttes for anlæg ved indberetningen, er temmelig uhensigtsmæssigt. Det udgøres nemlig af flere oplysningsfelter (kommunenummer, anlægstype, løbenummer og undernummer), hvoraf især anlægstypen også er informationsbærende. Hvis anlægstypen for et anlæg ændres - som følge af en reel ændring eller som følge af en ny tolkning - så ændres anlæggets identifikation også. Det er et led i den nuværende indlæsningsprocedure på GEUS, at et anlæg med en ny identifikation forsøges matchet med tidligere indberettede anlæg efter forskellige regler. Men hvis der ikke er tilstrækkelig med oplysninger til at fastslå, at der er tale om det samme anlæg, vil de ikke blive sammenlagt. Dette er først og fremmest et problem, hvis man vil arbejde med tidsserier for et enkelt anlæg, og derfor ikke så vigtigt ved den aktuelle undersøgelse. Det giver dog noget "mudder" i statistikberegningen, men ved at begrænse dataperioden til 1994-2004 begrænses også størrelsen af dette problem (se afsnit 4.1.1.2).

Den nærhedsanalyse, der er omtalt i afsnittet om håndtering af usikkerheden i de producerede kort, kan benyttes til at minimere problemet yderligere.

3.4.1.5 Manglende koordinater

Ca. 3 % af de anlæg, der skulle med i undersøgelsen, manglede oplysninger om vandværkets placering. For store anlæg er denne oplysning måske heller ikke så interessant, da både indvindingsboringer og forsyningsadresser kan ligge langt væk, men for mindre anlæg vil den være relevant. For en del af disse kan man ud fra oplysningerne om tilhørende boringer benytte en af disse boringers koordinat. De øvrige anlæg uden koordinater er blevet forsynet med skønnede koordinater ud fra adresseoplysninger o. lign. - men kun for de, der har en stor indvinding.

Som en ekstra koordinatkontrol undersøges det, om det kommunenummer, der angiver anlæggets administrative tilhørsforhold også stemmer med nummeret på den kommune, som koordinaterne angiver. I 55 tilfælde var de ikke ens - men det behøver ikke at være en fejl. Alle er undersøgt og kun 3 fejl blev fundet og rettet.

3.4.1.6 Indvindingsoplysninger

For at kunne vurdere betydningen af vandforsyningen fra det enkelte anlæg udtrækkes også de tilgængelige indvindingsoplysninger.

3.4.1.7 Få analyser til anlægget

I gennemsnit vil der være 11 analyser af fluorid for et anlæg i perioden 1994-2004. Dette tal dækker dog over udsving fra 1 til 127. Hvis der for et givet anlæg er under 5 analyser - og der tillige er under 5 år mellem den ældste og den nyeste – bliver datagrundlaget anset for at være for tyndt, og anlægget udgår af datamaterialet. Forinden er der dog lavet en række test, for at analysere om disse anlæg ikke har markante anderledes fluoridværdier end de øvrige i deres omegn. Fjernelsen af dem vil derfor ikke betyde en ændring af fluoridforholdene – blot en forenkling af kortet.

3.4.1.8 Sammenfatning af udvælgelseskriterier

Kriteriet for at et anlæg kan indgå i materialet kan nu sammenfattes således:

1.       Det skal være et anlæg til fælles vandforsyning

2.       Der skal findes mindst 2 fluoridanalyser i perioden 1994-2004 – og hvis der er under 5, skal der mindst være 5 år mellem den ældste og den nyeste

3.       Der skal findes mindst ét indvindingstal i perioden 1994-2004

4.       Der skal være koordinater til anlægget eller tilknyttede boringer

3.4.2 Lokal statistisk bearbejdelse

For de anlæg og analyser, der opfylder de ovennævnte kriterier, gennemføres følgende indledende statistisk bearbejdning: Data aggregeres på anlægsniveau. Der udregnes medianen af de tilhørende fluoridanalyser og gennemsnittet af de tilhørende indvindingstal.

3.4.3 Fremstilling af teoretisk forsyningskort

Der er fremstillet et teoretisk forsyningskort i 2 udgaver. Begge er fremstillet ud fra identisk datagrundlag, men er forskellige derved, at kun det ene inddrager vandværkets indvindingsmængde.

Det var oprindelig tanken, at inddrage konkrete forsyningsplaner i områder hvor der var en sådan usikkerhed. For en række af de største vandforsyninger er der fundet sådanne oplysninger - dog ikke på digital form. De introducerer dog nye metodiske problemer. For Københavns Energis (KE) vedkommende findes oplysninger om hvilke kommuner, der leveres til, og hvor stor en del af disse kommuners forsyning vandet fra KE udgør. Der vil dog ofte ske en opblanding af dette vand med vand fra lokale vandværker, og vi vil få vanskeligheder med at komme med et kvalificeret bud på fluoridindholdet i det vand, der leveres til en konkret adresse. I alle de store vandforsyninger vil der være mulighed for sammenblanding af vand fra forskellige kildepladser.

Som yderligere illustration af kompleksiteten i vandværkernes forsyningsområder vises her det forsyningsområde, som drikkevands-sektionen af det store forsyningsselskab TRE-FOR offentliggør på deres hjemmeside.

Figur 4 Forsyningsområde for TRE-FORs vandforsyning (fra selskabets hjemmeside, www.tre-for.dk)

Figur 4 Forsyningsområde for TRE-FORs vandforsyning (fra selskabets hjemmeside, www.tre-for.dk)

Som det ses, er der tale om et meget sammensat område, hvis udbredelse bl.a. er bestemt af placeringen af kildepladser (midt i Egtved kommune) og samspillet med andre forsyningsselskaber (Børkop kommune ikke med).

For begge udgaver af det fremstillede forsyningskort tages der udgangspunkt i den registrering af vandværkets placering, som findes i Jupiter-databasen. Denne koordinat skal ideelt set vise placeringen af det tekniske behandlings-anlæg. For mindre anlæg er dette punkt veldefineret (midt i den ene bygning, der typisk vil være tale om). For disse anlæg vil såvel de anvendte boringer som forsyningsadresserne typisk være i umiddelbar nærhed af vandværket. For større vandværker vil det være vanskeligere at udpege et enkelt punkt – og relevansen af punktets placering vil også være mindre set i forhold til de forsynede adresser. For eksempel er TRE-FOR i Jupiter-databasen repræsenteret af 6 vandværker, der er placeret rundt omkring i forsyningsområdet.

Figur 5 Placering af de 6 TRE-FOR vandværker fra Jupiter databasen i forhold til forsyningsområdet

Figur 5 Placering af de 6 TRE-FOR vandværker fra Jupiter databasen i forhold til forsyningsområdet

Disse værker har forskellig størrelse – indvinder mellem 4.000 og 2.5 mil. m³ vand om året – og deres vand vil sandsynligvis ofte blive blandet sammen før levering til forbrugerne. Hvis fluoridindholdet i det leverede vand var meget forskelligt værkerne imellem, ville denne forsyningsstruktur være med til at forøge usikkerheden i vores cariesundersøgelse. I dette tilfælde ligger det gennemsnitlige fluoridindhold mellem 0,13 og 0,19 mg/l for de 6 værker, og det har reelt, i forhold til den aktuelle problemstilling, ingen betydning, men andre steder i landet kan der være større forskelle i vandet fra forskellige værker i samme forsyningsselskab.

Den udgave af forsyningskortet, der ikke inddrager oplysninger om indvindingsmængde, er fremstillet ved en simpel opdeling af hele Danmarks areal, således at ethvert punkt tilknyttes det anlæg, der er tættest på (kaldet Thiessen-polygoner).

I den anden udgave (kaldet det cirkulære kort) opdeles anlæggene i kategorier efter deres gennemsnitlige årlige indvindingsmængde. Der bygges herefter på følgende principper/antagelser:

  • Vandet benyttes i nærheden af vandværket
  • Nærhedskriteriet har størst vægt for små vandværker
  • Arealet af forsyningsområdet er proportionalt med indvindingsmængden
  • Arealberegningen er forskellig for landområder og byområder
  • En husstand bruger ca. 120 m³ pr år

Anlæggene opdeles i byanlæg og landanlæg på grundlag af deres placering i forhold til et GIS-tema med byomrids. Der skønnes herefter en forsyningsradius for hver indvindingskategori – og for nogle kategorier er den forskellig for hhv. by og land. Herefter beregnes ved hjælp af GIS-procedurer i første omgang et sæt cirkulære forsyningsområder for hver af de enkelte kategorier. Hvis to eller flere vandværker i samme kategori ligger tættere på hinanden end den anvendte forsyningsradius fordeles deres områder vha. Thiessen-polygoner (se ovenfor). De beregnede forsyningsområder for alle kategorier samles herefter på en måde, som prioriterer de små anlægs områder højest. Dvs. at hvis et punkt falder inden for den forholdsvis lille forsyningsradius for et lille vandværk, så anses dette punkt som hørende til det lille vandværk – uanset om punktet også faldt inden for et større vandværks forsyningsradius. Ved denne metode vil der også blive enkelte områder af landet, som ikke tilknyttes til et vandværk, men det vil oftest være områder med få adresser. En undtagelse er f.eks. det sydvestlige Lolland, hvor indvindingsforholdene er meget vanskelige og der følgelig ikke er placeret nogen vandværker. Adresser i disse områder vil udgå af undersøgelsen.

3.4.4 Håndtering af usikkerheden i de producerede kort

Det fremgår af de automatisk producerede forsyningskort, at variationen i fluoridindholdet i vand fra tætliggende vandværker kan være stor i nogle områder. Mens den præcise placering af den beregnede afgrænsning af det enkelte vandværksforsyningsområde ikke er så vigtig i de områder, hvor fluoridindholdet viser stor regional stabilitet, vil betydningen af en forkert beregnet forsyningsgrænse være stor i de områder, hvor fluorid indholdet viser stor lokal variation. For at få et kvantitativt udtryk for denne usikkerhed er følgende beregning udført: Ved hjælp af en GIS-analyse identificeres for hvert anlæg de 4 anlæg, der ligger tættest på (i luftlinie). Median-fluorid-værdierne fra disse anlæg hentes og sammenstilles med anlæggets egen værdi. Blandt disse 5 værdier findes den højeste og laveste og forskellen på disse udregnes. Størrelsen af dette tal vil være et kvantitativt udtryk for usikkerheden af forsyningskortet i det pågældende vandværks forsyningsområde. Eksempelvis vil et vandværk, hvis fluorid-værdi ligger markant over de nærliggende vandværkers, bevirke, at både dets eget og nabovandværkernes forsyningsområde bliver markeret som usikre områder. Vi har overvejet, om denne værdi (som jo er en forskel i mg/l) burde sættes i forhold til det absolutte niveau af vandværkets fluoridværdi (eller gennemsnittet af de 5 værdier) og dermed udtrykkes i procent. Dette ville dog bevirke, at områder med meget lave fluoridværdier vil have meget større risiko for at blive betegnet som usikre områder - og det passer dårligt med den eksisterende viden om fluorids betydning for caries. Vi har derfor valgt at benytte den absolutte forskel som "sikkerhedsindikator". Vi vil herefter undersøge om den fundne sammenhæng mellem fluorid og caries viser sig mere markant i kortets sikre områder end i de usikre. Antagelsen er her, at den høje risiko for at en adresse knyttes til et anlæg med en markant anderledes fluoridværdi end det anlæg, som i virkeligheden forsyner adressen, vil bevirke en sløring af sammenhængen. Se i øvrigt beskrivelsen af den statistiske bearbejdning.

3.4.5 Videre anvendelse og samkøring af fluorid-data

Det endelige resultat af databearbejdningen af fluoriddata fra GEUS’s Jupiter database er altså et digitalt kort, der opdeler det danske landområde i små polygoner, hvortil der er knyttet attributter om fluoridindholdet i vandet fra et nærliggende vandværk. Den primære attribut er medianværdien af fluorid-indholdet for analyserne fra de sidste 10 år. Ved en simpel GIS-operation, kan alle adressepunkter med cariesoplysninger få overført fluoridoplysningerne fra kortet. Den derved dannede kombinationstabel er basis for den videre statistiske analyse.

3.5 Dataanalyse

Der er udtrukket data til i alt 4 kohorter, defineret ved fødselstidspunkt og opfølgningslængde. Kun forløb, hvor der er oplysning om bopæl i hele forløbet samt oplysninger om SCOR data indgår. Hver kohorte er dels analyseret for alle deltagere (de fuldt optrukne, blå pile), dels alene for den undergruppe, der har haft samme bopæl i hele perioden (de stiplede, røde pile), og hvor eksponeringen (fluoridindholdet) derfor må antages at være ens gennem hele perioden. Data er skitseret i nedenstående Figur 6, hvor kohorternes størrelse ligeledes er angivet.

For en af kohorterne, K89c, blev der endvidere udarbejdet et datasæt med mere detaljerede eksponeringsoplysninger med henblik på at vurdere betydningen af nøjagtigheden af vandforsyningstildelingen (se afsnit 3.4.4).

For kohorter med 15 års opfølgning (K79a og b, K89c og d) benyttes som outcomemål carierede, ekstraherede på grund af caries og fyldte flader på permanente tænder (DMFS), på kohorter med 5 års opfølgning (K89a og b, K99a og b) antallet af carierede, ekstraherede på grund af caries og fyldte flader i primære tænder (dmfs).

Figur 6 Undersøgte kohorter, benævnt efter fødselsår. Stiplede linier er kohorter med samme bopæl i hele undersøgelsesperioden, ustiplede linier kohorter med kendt, men ikke nødvendigvis samme, bopæl i hele perioden. Den lodrette streg angiver påbegyndelse af opfølgning for permanente tænder. Pilehoved angiver SCOR-måling. Tallet under hver kohorte angiver antal i kohorten

Figur 6 Undersøgte kohorter, benævnt efter fødselsår. Stiplede linier er kohorter med samme bopæl i hele undersøgelsesperioden, ustiplede linier kohorter med kendt, men ikke nødvendigvis samme, bopæl i hele perioden. Den lodrette streg angiver påbegyndelse af opfølgning for permanente tænder. Pilehoved angiver SCOR-måling. Tallet under hver kohorte angiver antal i kohorten

Fra CPR-nummeret blev udtrukket oplysning om køn.

Husstandsindkomsten 2004 er angivet for alle deltagere, men afspejler for 79 kohorterne forhold for den voksne (25-årige) frem for økonomiske forhold under opvæksten. Husstandsindkomsten er analyseret, men præsenteres ikke, da de ikke umiddelbart kan tolkes.

Data er konverteret til STATA format med brug af oversættelsesprogrammet StatTransfer version 7.

Alle analyser er foretaget i STATA version SE 8.2.

Kohorterne er defineret i CPR-registret, men en del personer er flyttet mellem forskellige adresser i perioden. Enkelte er i kortere eller længere perioder ikke tilknyttet identificerbare adresser, og da eksponeringen for fluorid derfor ikke har kunnet fastlægges, er disse udgået af kohorten. De resterende medlemmer af kohorten har alle fuldstændige adresseoplysninger. Der er beregnet et fluorideksponeringsniveau af adressens fluoridkoncentration og den tid personen har boet på den enkelte bopæl[2]. Kohorterne er underinddelt efter om de har boet samme sted i hele eksponeringsperioden (fastboende), hvorved de har været eksponeret for samme fluoridkoncentration.

Fluoridkoncentrationen er opdelt i 5 grupper, defineret med arbitrære grænser. For husstandsindkomst er data i hver kohorte opdelt i 4 lige store grupper, hvorved grænserne mellem grupperne i kohorterne er blevet forskellige. Begrundelsen herfor er dels, at husstandsindkomstens fordeling er meget forskellig fra kohorte til kohorte og dels at benyttelsen af faste grænser mellem grupperne derfor vil medføre at nogle grupper bliver meget små. Det er vurderet, at dette ikke har betydning for tolkningen, idet projektets fokus ikke har været på sociale forskelle.

Der er flere målinger for fluoridkoncentrationen. Analyserne er udarbejdet med såvel mediane målinger i det cirkulære kort som i Thiessen kortet, men resultaterne har været stort set ens, hvorfor kun resultater med cirkulære kort præsenteres.

Der er primært foretaget en vurdering af de enkelte variables fordeling i hver af kohorterne, dernæst en visuel undersøgelse af sammenhængene mellem variablene, efterfulgt af testning hvor det har været relevant.

Fordelingerne af især outcome og eksponeringsmålene er ikke Gaussiske, og der er derfor primært benyttet non-parametriske tests for henholdsvis trends (nptrend) og grupperinger (Kruskall-Wallis).

Endelig er den multivariate sammenhæng vurderet i en logistisk regressionsanalyse. I analyserne er udfaldsvariablen dikotomiseret svarende til henholdsvis medianen og til niveauer, vurderet som klinisk relevante. Alle logistiske regressionsmodeller er efterfølgende testet med Hosmer-Lemeshow test.


Fodnoter

[2] I princippet (fluoridkoncentrationa x tida) + (fluoridkoncentrationb x tidb) + .. + (fluoridkoncentrationn x tidn)

 



Version 1.0 December 2007, © Miljøstyrelsen.