Har fluorid i drikkevand en betydning for caries hos børn ?

5 Diskussion

5.1 Kvalitet og relevans af de fundne resultater vedrørende fluorid i drikkevand og cariesforekomst

Nærværende projekt har bekræftet den negative association, der tidligere er dokumenteret mellem drikkevandets indhold af fluorid og caries.

Associationen mellem drikkevandets fluoridindhold og caries i Danmark blev beskrevet i 1960’erne (Møller, 1965). I mellemtiden er fluoridholdig tandpasta blevet indført, og langt den største del af tandpastaforbruget i Danmark er i dag fluoridholdigt. I en undersøgelse af Ekstrand et al., 2005 benyttedes data om fluorid i drikkevand fra de enkelte vandværker fra perioden 2000-2004 som gennemsnitsværdier. Caries blev udtrykt ved gennemsnitlige DMFS-værdier på 12-, 15- og 18-årige i 2004, alle på kommuneniveau. Undersøgelsen af Ekstrand et al. er således ikke baseret på egentlig samkøring af data fra registre, og såvel cariesdata som data om drikkevandets fluoridindhold blev aggregeret på kommuneplan. Den information, der ligger i den intra-kommunale variation i drikkevandets fluoridindhold og cariesforekomsten på individniveau, blev således ikke udnyttet. Selvom information om både drikkevandets fluoridindhold og caries er indsamlet ”tættere” på individniveauet i denne undersøgelse, og selvom der i analyserne tages højde for socioøkonomisk status findes der stadig en effekt af fluorid i drikkevand, på trods af den intensive anvendelse af fluortandpasta og tandpleje.

Selv om kvaliteten af data i dette studie er forbedret betydeligt i forhold til tidligere undersøgelser er der mulighed for at optimere data yderligere, idet kun SCOR-data og data fra SKAT er analyseret på individniveau. Det har ikke været muligt at fremstille et forsyningskort, hvor man kunne relatere den enkelte bolig til et bestemt vandværk. Det betyder, at drikkevandsdata ikke foreligger på individniveau, og der er store usikkerheder om eksponeringen i visse områder, hvor fluoridindholdet i drikkevand varierer betydeligt selv inden for et forholdsvis begrænset geografisk område.

Der er forsøgt at lave en omfattende kvalitetskontrol på de anvendte fluoriddata. Da der er forskellige fejlmuligheder, der kan påvirke fluoriddata, herunder analysefejl eller skrivefejl på de enkelte vandværker/anlæg har vi forsøgt at minimere disse fejl ved at gennemgå data og rense dem for de store variationer. Der foregår i dag en ret omfattende kvalitetskontrol af data - både som kontrol af den enkelte indberetning og som en sammenligning med tidligere indberettede data fra det samme anlæg. Datakvaliteten er betydelig bedre end tidligere. Det betyder, at der kan sikres en bedre datakvalitet ved at lade de ældste analyser udgå af undersøgelsen. Vi har derfor kun medtaget data fra 1994 og frem.

Ca. 3 % af de anlæg, der skulle med i undersøgelsen, manglede oplysninger om vandværkets placering. For en del af disse kunne man ud fra oplysningerne om tilhørende boringer benytte en af disse boringers koordinat. De øvrige anlæg uden koordinater er blevet forsynet med skønnede koordinater ud fra adresseoplysninger o. lign. - men kun for de, der har en stor indvinding. Som en ekstra koordinatkontrol er det undersøgt, om det kommunenummer, der angiver anlæggets administrative tilhørsforhold også stemmer med nummeret på den kommune, som koordinaterne angiver. I 55 tilfælde var de ikke ens - men det behøver ikke at være en fejl. Alle er undersøgt og kun 3 fejl blev fundet og rettet.

I gennemsnit vil der være 11 analyser af fluorid (variation mellem 1 og 127) for et anlæg i perioden 1994-2004. Hvis der er under 5 analyser - og der tillige er under 5 år mellem den ældste og den nyeste – blev datagrundlaget anset for at være for tyndt, og anlægget er udgået af datamaterialet. Forinden er der dog lavet en række test, for at analysere om disse anlæg ikke har markant anderledes fluoridværdier end de øvrige i deres omegn.

Der blev desuden foretaget analyse af variation over år og data blev beregnet som et gennemsnit over 10 år. Det store antal data, den 10-årige periode og den aktuelle kvalitetskontrol har bidraget til at minimere fejlkilderne på fluoriddata mest muligt.

Anvendelse af social klasse / social gruppe i stedet for husstandsindkomst ville muligvis have forbedret analyserne, men det var ikke med ønsket om anvendelse af GIS-værktøjet muligt at anvende data fra Danmarks Statistik.

Det er velkendt, at særlige sociale grupper, herunder børn af fremmed etnisk herkomst har en højere cariesforekomst end andre (Sundby A., 2001). Vi har ikke haft data i denne undersøgelse til at analysere disse sammenhænge.

Husstandsindkomsten blev i denne undersøgelse defineret som den samlede skattepligtige indkomst for personer bosiddende på samme adresse som børnene i undersøgelsen, og som samtidig var registreret som forældre til barnet i CPR-registret. Dette kan muligvis betyde, f.eks. for børn, der er i sammenbragte familier, at husstandsindkomsten ikke afspejler den samlede husstandsindkomst, der reelt er i familien.

Det ville have været muligt at identificere indvandrerne i 1. og 2. generation på baggrund af registeroplysninger. Det er dog også velkendt at en større andel af disse samtidig vil tilhøre gruppen med lavere husstandsindkomst, hvilket der er taget højde for i studiet (kontrolleret for confoundere).

I dette studie har det ikke stor betydning for resultatet at indskrænke analysen til dem, der har boet samme sted i hele perioden. Det kan enten forklares ved, at vores eksponeringsmodel (? antal år på den pågældende bopæl x fluoridkoncentration) er dækkende, eller at befolkningen overvejende flytter inden for det samme geografiske område, hvor fluoridkoncentrationerne stort set er de samme.

Det synes på basis af ovennævnte mest relevant at benytte resultaterne fra hele den gruppe af deltagere, hvor der er oplysninger.

I undersøgelsen af Ekstrand et al, 2005 findes ligesom i denne undersøgelse en dosis-respons sammenhæng mellem koncentrationen af fluorid og udviklingen af caries, hvor effekten er højest i den højest eksponerede gruppe. Ekstrand et al. finder at effekten minimeres, når fluoridindholdet er < 0,3 mg/l. I nærværende studie findes en Odds Ratio på hhv. OR= 0,82, 0,68, 0,61 og 0,56 ved fluoridindhold på hhv. 0,125-0,250 mg/l, 0,250-0,375 mg/l og 0,375-1,0 mg/l, og >1 mg/l (sammenlignet med 0-0,125 mg/l). Der er således i denne undersøgelse til forskel fra Ekstrand et al. også fundet en nedsat risiko for cariesforekomst ved fluoridværdier under 0,3 mg/l.

I betragtning af den høje koncentration af fluorid, der findes i tandpasta (op til 1450 mg/kg) kan det undre at drikkevandets fluoridindhold, der samlet svarer til et bidrag på 0,32-0,56 mg/dag (ved fluoridindhold på 0,4 mg/l drikkevand) overhovedet har en betydning. Det er muligt, at det skyldes, at en vis procentdel af befolkningen ikke børster tænder med fluortandpasta. Disse mennesker får fordel af fluorid i drikkevandet.

I Danmark er der over en årrække opbygget en effektiv cariesforebyggelse i den kommunale tandpleje, som omfatter forskellige metoder til lokal fluorbehandling af tænderne, forsegling af kindtændernes fissurer, instruktion i tandbørstning med fluorholdig tandpasta og forskellige sundhedsoplysende aktiviteter rettet mod sundere kostvaner. Der sker således stadig et fald i cariesforekomsten. For 15-årige er gennemsnitligt DMFS på landsplan faldet fra 2,85 i 2004 til 2,60 i 2005 (Sundhedsstyrelsen, 2006).

Epidemiologiske undersøgelser har derfor også kunnet vise, at det i en række områder med ikke-fluoridholdigt drikkevand har været muligt at reducere cariesforekomsten til samme niveau, som i områder med et optimalt fluoridindhold i drikkevandet (Thylstrup et al., 1982).

Samlet er det således også fremover vigtigt, at målrette forebyggelsen mod områder med høj cariesforekomst og lavt fluoridindhold i drikkevandet.

5.2 Vurdering og beskrivelse af de tekniske og administrative problemstillinger ved den foretagne samkøring af registre (procesevaluering)

Der er i bilag A for hvert enkelt af de anvendte registre beskrevet anskaffelsessted (ejer), kontaktpersoner, indhold af registret, anvendte data, beskrivelse af dataformat, pris for rådata, behov for konvertering og prisen for dette.

I forbindelse med nærværende projekt blev det på et tidligt tidspunkt besluttet, at en ekstern programmør skulle bearbejde de modtagne rådata. Denne beslutning har vist sig at være særdeles værdifuld, idet databearbejdning af så store og komplekse datamængder fordrer specialkendskab til databaser og programmering. Data for de store registre er leveret i flere separate filer, baseret på den databaseopbygning der er i de respektive registre, mens de mindre registre er leveret som én fil.

I forbindelse med leverance af data er der vedlagt dokumentation i form af enten tekstbaserede beskrivelser eller elektroniske kodelister med tilhørende beskrivelser. Kvaliteten af disse beskrivelser har stor betydning for hvor store problemer der er i forbindelse med anvendelse af data. I nærværende projekt har CPR- og BBR- registrene generelt haft god tilhørende dokumentation. Dog tog det programmøren lidt tid at gennemskue opbygningen af dokumentationen til CPR-registret. Dokumentationen til BBR-registret er fra programmørens side beskrevet som værende overordentlig god og let gennemskuelig.

Nærværende projekt har vist at samkøring af registre indenfor miljø- og sundhedsområdet fordrer registre med høj konsistens og stor dækningsgrad, noget der i høj grad er opfyldt i danske registre. Specielt indenfor projekter der oparbejder registeroplysninger til en form for eksponeringsindeks er den historiske del af registreringerne vigtig. BBR indeholder ikke historiske oplysninger, idet opdateringer i registeret erstatter tidligere inddateringer. Dette er fra en miljø- og sundhedsmæssig tilgangsvinkel uheldigt, idet det derved ikke er muligt fuldt ud at anvende de historiske oplysninger i CPR-registret. Netop dette problem er aktuelt i nærværende projekt, idet adresser, der er registreret i BBR tilhørende en almen vandforsyning, få dage inden dataudtrækket kan have været forsynet fra en privat brønd. Herved vil der opstå fejl i eksponeringen, idet brønde og almene vandværker sjældent indvinder vand fra samme grundvandsmagasin, og dermed kan drikkevandets karakteristika være ændret væsentligt. Med baggrund i den viden vi har nu, havde det været hensigtsmæssigt at man i stedet for den eksisterende løsning på adressekoderne havde valgt en af to andre mulige løsninger: 1) Lade den enkelte adresse arve kommunekoden fra den nuværende kommune, eller 2) Anvende helt nye kommunekoder, f.eks. kommunekoder der ender på et lige tal, da disse ikke har været brugt til de eksisterende kommuner. Derudover ville det være særdeles relevant at oprette en ’historisk’ del af BBR i stil med den der eksisterer i CPR-registret. Et ’historisk’ BBR ville f.eks. kunne anvendes til at undersøge om nye tiltag på boligområdet har en given effekt i forhold til befolkningen. Dette er naturligvis svært såfremt man hver gang registret opdateres så at sige sletter fortiden.

I nærværende projekt er der forsøgt anvendt indkomstdata fra SKAT som proxy for social klasse / socialstatus. Det havde været hensigtsmæssigt såfremt data med indkomstoplysninger over en given kohortes eksponeringsperiode havde været anvendt. Dette var ikke praktisk muligt med data fra SKAT. For at løse dette problem skulle data fra Danmarks Statistik (DST) have været anvendt. Imidlertid giver inddragelse af data fra DST problemer, idet DST’s diskretionspolitik er langt strengere end andre dataholdere. Således er det ikke muligt at arbejde med data der indeholder CPR-numre udenfor DST’s datanetværk. Det betyder at det ikke er muligt at anvende GIS til analyserne, idet GIS ikke forefindes på de sikrede forskermaskiner. DST har således en langt mere restriktiv datapolitik end de fleste andre dataholdere, der udleverer data indeholdende personfølsomme data, så længe der foreligger en godkendelse fra Datatilsynet.

 Fremskaffelsen af SCOR data fra dataleverandør gik forholdsvis hurtig, men det må anses for et problem, at data leveres i et format, der ikke er tilgængeligt for standard statistikprogrammer, og at det derfor forudsætter programmør for at få dem konverteret. Hvis data ønskes leveret i et andet format, kræves der en systemtilretning. Omkostningerne ved dette kendes ikke (Hansen, 2006).

Der er derudover i løbet af projektet identificeret følgende problemer i relation til SCOR-databasen:

  • Der forekommer gengangere, dvs. individer, der er registreret 2 eller flere gange i et år, pga. f.eks. flytninger fra en skole til en anden, eller fra en kommune til en anden
  • I SCOR-databasen fandtes ca. 1.000 individer, der ikke kunne genfindes i CPR-registret
  • Et mindre antal individer i SCOR-databasen kan via de sidste 4 cifre i CPR-nummeret identificeres som værende født i 1800-tallet

5.3 Erfaringer med samkøring af data

I den aktuelle registersamkøring mellem adresser og drikkevandsanalyser har vi anvendt GIS til at fremstille teoretiske, beregnede forsyningskort i mangel af rigtige forsyningskort. Desværre er forsyningsområderne i virkelighedens verden ofte temmelig komplicerede og vanskelige at konstruere ud fra de tilgængelige oplysninger. De teoretiske forsyningskort forsynet med en fluoridværdi vil afspejle de større regionale forskelle i drikkevandets fluorid-indhold, men de mere detaljerede lokale forskelle i tætliggende vandværkers vandkvalitet vil ikke kunne knyttes til forbrugsadresser med tilfredsstillende sikkerhed.

De fremstillede forsyningskort er bibeholdt i en form, der i princippet er automatisk fremstillet ud fra de tilgængelige registeroplysninger. En mulighed for at kontrollere datas validitet kunne være at udvælge et antal tilfældige projektdeltagere, finde de faktiske fluoridværdier i det vandforsyningsanlæg, der forsyner vedkommendes bopæl og sammenligne med de estimerede værdier. En anden mulighed var at udelade de områder, hvor værdierne er mest usikre. Forslagene ligger dog ud over det herværende projekts rammer.

I forbindelse med samkøring af forskellige registre opdages altid uregelmæssigheder der ikke umiddelbart lader sig afdække i det enkelte register alene. Disse uregelmæssigheder opstår ofte med baggrund i enten manglende oplysninger i enkelte registre, eller forskelle i registrering af den samme variabel i flere forskellige registre. I nærværende tilfælde er der især uregelmæssigheder i forhold til samkøring mellem CPR-registret og adresseregistret, det der med en geografisk term kaldes geokodning. Geokodningen består i oprettelse af en reference mellem et register med de variable der skal indgå i en analyse og et register med tilhørende koordinater. Herved er det mulige at placere de enkelte oplysninger fra registrene i en geografisk ramme, eller mere simpelt: På et kort. I nærværende projekt er de geokodede variable afgrænset ved tre årgange, hhv. 1979, 1989 og 1999.

Tidligere erfaringer med geokodning af CPR-registret har vist, at de aktuelt gældende data er særdeles gode, ligesom historiske oplysninger dækkende tilbage til 1986 generelt har en høj geokodnings-rate. Oplysninger der er ældre end 1986 er langt mere usikre, hvilket formodentlig i høj grad bunder i tidligere tiders manglende husnumre samt nedlæggelse af veje.

En arbejdsgruppe under Videnskabsministeriet har tidligere i 2000 angivet, at den adgang der var til at forskere kunne arbejde på Danmarks Statistiks edb-anlæg fra arbejdsstationer i København eller Århus skulle udvides således at autoriserede forskningsmiljøer kunne sikres en on-line adgang, der medførte, at man over hele landet kunne arbejde i egne institutioner på Danmarks Statistiks data. Desuden blev det påpeget, at der var store omkostninger forbundet med at anvende de pågældende data. Man har derfor besluttet, at man fremover alene skal betale for konstruktion af konkrete datasæt efter timelønstakst (IT- og Forskningsministeriet, 2001).

Denne mulighed er til stede i dag, hvor etablerede forskningsmiljøer kan få oprettet krypterede linier til at arbejde på datasæt i DST. Imidlertid skal alle datasæt forblive på DST’s maskiner, datasæt skal tillægges DST data og anonymiseres efterfølgende og adgang til at analysere data kan kun ske med de programmer, der er installeret på DST.

Da dette projekt har foretaget oparbejdning af data løbende, ville der kun med besvær have været mulighed for at samle datasættene i DST. Samtidig ville det være umuligt at arbejde med GIS-programmerne, der ikke er en del af programmellet på forskermaskinerne.

I forbindelse med udvalgsarbejdet under Videnskabsministeriet blev det besluttet at nedsætte taksten for anvendelse af CPR-registret, hvilket dette projekt har haft glæde af (pris i alt 10.000 kr. for alle oplysninger, inklusive de historiske oplysninger).

Man påpegede tillige fra udvalgets side, at der ikke sker en systematisk erfaringsopsamling med hensyn til validiteten og kvaliteten af data. Der er således ikke nogen systematisk tilbagerapporteringspligt til de dataansvarlige omkring de fejl og mangler, der findes under forskningsprocessen. Vi er heller ikke i relation til indhentning af data til dette projekt blevet anmodet om tilbagerapportering af fejl eller mangler. Det indebærer at andre forskergrupper vil skulle foretage samme oprensning som vi selv har gjort.

Vi har i dette projekt anvendt geo-kodning (OSAK) som fælles nøgle, som foreslået af Poulstrup (2003).  Metoden vurderes som yderst anvendelig i relation til samkøring af registre.

Procesforløbet i projektet fremgår af Tabel 8. Tabellen illustrerer procesforløbet i det aktuelle projekt og vil ikke nødvendigvis afspejle forholdene i andre projekter.

Tabel 8 Beskrivelse af procesforløbet

  Dato Varighed i måneder
Projekt-forberedelsesfase
§  Udbud fra Miljøstyrelsen
§  Udfærdigelse af projektansøgning
§  Ansøgningsfrist
§  Projektbevilling
Januar 2005
Marts 2005
30. marts 2005
15. april 2005 (betinget tilsagn)
4 måneder
Projektstart-fremskaffelse af data
§  Ansøgning til datatilsynet
§  Anmodning om data fra CPR-registret
§  Ansøgning til Sundhedsstyrelsen om
       anvendelse af SCOR-data
§  SST-ansøgning til Datatilsynet om god-
       kendelse af udlevering af SCOR-data
§  Anmodning om SCOR-data hos
       dataleverandør
§  Udlevering af SCOR-data
§  Anmodning om BBR-data
§  Tilsendelse af BBR-data
§  Anmodning om data fra Skat via
        Borgerservice
§  Levering af data fra Skat
Maj 2005
Juli 2005
Juni 2005
Tilladelse august 2005
1. August 2005
9. August 2005
Medio juni 2005
Ultimo juni 2005
Primo oktober 2005
Ultimo december 2005
8 måneder
Oprensning og databehandling
§  Oprensning af Jupiter-data
§  Databehandling – Jupiter
§  Databehandling (øvrige data) v. ekstern
        konsulent
1. august 2005
20. oktober 2005
August 2005
3 måneder
Bearbejdning og statistiske analyser
§  Databearbejdning
§  Statistisk analyse
September 2006
Februar 2006
6 måneder
Rapportskrivning
§  1. udkast
§  2. udkast
December 2006
Februar 2007
12 måneder

Den primære projektperiode fra projektbevilling til afslutning var beregnet til ca. 1 år. Som det fremgår af tabellen er der i stedet forløbet 29 måneder, altså en forlængelse af projektperioden på det dobbelte. Fremskaffelse af data viste sig at tage 8 måneder i stedet for de beregnede 3 måneder, datasamkøring og den statistiske bearbejdning var vurderet at tage 3 måneder men det tog 6 måneder, og rapportskrivningen var vurderet til 5 måneder, men tog 12 måneder. Årsagerne var flere, herunder længere leveringstid fra dataleverandører, og at det var nødvendigt at foretage fornyede analyser pga. fejl i det primære datasæt. Projektet kørte desuden sideløbende med et andet projekt, hvor der var forsinkelse på dataleverancerne, hvilket også var bestemmende for deadline for færdiggørelse af dette projekt.

Det kan anbefales, at man sørger for at tage højde for sådanne faktorer i fremtidige projektansøgninger, da det kan få afgørende indflydelse på projektets finansiering – og færdiggørelse. Det er også vigtigt at bevillingsmyndigheden sørger for at forlænge projektperioden, således at der tages højde for et evt. senere starttidspunkt for projektet.

5.4 Bortfald

De oprindelige 4.000 fælles vandforsyningsanlæg med 50.000 analyser fra 1989-2004 blev i relation til kvalitetssikringen af data reduceret til 3.000 med tilsammen 34.000 analyser svarende til en anvendelse af i alt 68 % af det samlede antal analyser. Samtidig med at kvaliteten af de tilbageblevne data blev bedre, blev antallet således også reduceret betydeligt.

Af Tabel 9 fremgår antal 5- og 15-årige registreret i henholdsvis CPR, SCOR og BBR, samt andel hvor der forefandtes skatteoplysninger.

Tabel 9 Bortfald. Antal 5- og 15 årige i henholdsvis 1979, 1989 og 1999, der er registreret i CPR- og SCOR-registret.

  CPR SKAT SCOR BBR* Samme bopæl Flyttet
Kohorte            
15-årige            
1979 62.901 58.366 51.657 40.677 23.974 16.703
1989 67.261 64.223 52.645 43.848 23.304 20.544
             
5-årige            
1989 64.635 61.447 52.512 45.332 24.580 20.752
1999 69.997 66.236 55.372 48.351 23.796 24.555

* personen kan følges i hele undersøgelsesperioden

Som det ses, er der for 15-årige i 1989-kohorten i alt 67.261 registreret i CPR-registret. Der er skatteoplysninger på 64.223 (95,5 %), oplysninger i SCOR på 52.645 (78,3 %) og oplysninger i både SKAT, SCOR og BBR på 43.848 (65,2 %).

Der har igennem mange år været oparbejdet en fast procedure blandt tandlæger med registrering af alle børn i SCOR. Af besparelsesgrunde overgik man til registrering af særlige årgange (5-, 7-, 12- og 15-årige). Dette kan medføre en større risiko for at ’glemme’ at registrere. Cariesdata i dette projekt stammer fra årgange (5- og 15-årige), hvor der er registreringspligt.

I aktuelle projekt er der 20-25 % af 5 og 15 årige børn, der ikke registreres i SCOR, og blandt bortfaldet er flere fra lavere indkomstgrupper. En mulighed er, at tandlægerne ikke husker at registrere, men en anden nærliggende mulighed er, at det er børn fra de socialt dårligst stillede familier, der heller ikke kommer til de obligatoriske tandeftersyn. Der kan således ligge et yderligere forebyggelsesperspektiv i at foretage en målrettet indsats over for denne gruppe.

For K89c, som var kohorten fra 1989, fulgt 15 år med samme bopæl i eksponeringsperioden, blev foretaget en nærmere sammenligning mellem dem, der indgik og dem, der ikke indgik i analyserne. Der var ingen kønsforskel mellem grupperne. For dem, der ikke indgik på grund af manglende oplysninger om bopæl i 15 års opfølgningen, var der ingen betydende forskel i DMFS i forhold til dem, der indgik (median og IQR i begge tilfælde 0 (0-3)). Forskellen var dog statistisk signifikant (Mann-Whitney, p<0,0000).

For gruppen, der blev ekskluderet på grund af manglende SCOR data, var der tilsvarende kun lille forskel i fluoridkoncentrationen (median og IQR 0,22 (0-1,95) og 0,24 (0,07-1,95)) henholdsvis. Sandsynligheden (p-værdien) for den fundne forskel var også her mindre end 0,0000.

I begge tilfælde havde grupperne, der blev ekskluderet betydeligt lavere husstandsindkomst end de deltagende. Medianindkomsterne var 228.029 og 292.322 i de to grupper udelukket på baggrund af henholdsvis bopælsoplysninger og manglende SCORdata, mod 447.617 for deltagerne.

 



Version 1.0 December 2007, © Miljøstyrelsen.