Forprojekt om samkøring af registerdata for miljø og sundhed

4 Erfaringer og initiativer med samkøring af miljø- og sundhedsdata og GIS

4.1 Tidligere erfaringer med at sammenholde af miljø- og sundhedsdata
4.2 Nyere udvikling
4.3 GIS Sundhed DK
4.4 Nogle kvalitative betragtninger omkring kobling af miljø- og sundhedsdata
4.5 Nogle tekniske aspekter omkring en række centrale miljøregistre

4.1 Tidligere erfaringer med at sammenholde af miljø- og sundhedsdata

Der har gennem årene været gennemført adskillige ad hoc undersøgelser til belysning af eventuel sammenhæng mellem kendt eller formodet miljøpåvirkning og helbred. Der har typisk været tale om at sammenholde viden om miljøforhold med kendte helbredsdata, men uden at der har været foretaget en egentlig teknisk kobling af registerdata.

Således kan nævnes undersøgelser for sammenhæng mellem Atrazin i drikkevand og misdannelser (Ejstrupholmsundersøgelsen). En sundhedsplejerske havde gennem et par år konstateret flere tilfælde af medfødte misdannelser, således 4 børn med rygmarvsbrok i samme parcelhuskvarter. Kort tid efter konstaterede man gennem amtets grundvandsovervågning betydelige mængder af plantegiften Atrazin i grundvandet og dermed i drikkevandet til byområdet. Selv om man kunne afgrænse baggrundsbefolkningen og til dels kendte deres forbrug af det forurenede vand, mente man ikke at tallene var store nok til at kunne foretage en holdbar statistisk vurdering, ligesom sammenhæng mellem Atrazin og helbredsskader hos mennesker var dårligt belyst.

Sammenhæng mellem kraftige magnetiske og elektriske felter og hjernekræft hos børn har været debatteret i mange år, og også i Danmark har man gennemgået denne sammenhæng på baggrund af danske tal. Her sammenstillede man for nogle år siden oplysninger om magnet- og elektriske felters størrelse med skønnede informationer om det antal børn, der kunne have været udsat for høje feltpåvirkninger. Man endte med at udtale, at resultatet var inkonklusivt.

Det skal tilføjes, at en del forskere i dag vurderer, at der er en sammenhæng; således at forstå at risikoen for blodkræft hos børn er dobbelt så stor, hvis de bor/har boet i nærheden af relativt kraftige elektromagnetiske felter; det vil som oftest sige højspændingsledninger. Man har hertil anvendte undersøgelsesdata fra hele verden til en samlet analyse (metaanalyse), hvorved den statistiske styrke er blevet stor nok til et konklusivt resultat.

Radioaktiv stråling er normalt ikke et forhold, der er aktuelt i Danmark, men efter en brintbombe-ulykke i Thule/Grønland blev det aktuelt at belyse eventuelle senere helbredsskader hos de arbejdere, der stod for oprydningen. Man brugte her oplysninger om skønnede udsættelser for stråling og sammenholdt dem med de enkelte arbejderes symptomer og sygdom, som opstod i årene efter oprydningen.

I Danmark er det normalt Sundhedsstyrelsen og/eller Statens Institut for Folkesundhed (tidligere: Dansk Institut for Klinisk Epidemiologi):), der står for denne type undersøgelser.

4.2 Nyere udvikling

Karakteristisk for alle undersøgelserne har været, at der har været anvendt helbredsoplysninger hos en befolkningsgruppe, der har skullet defineres i rum og tid; hvilket har været en krævende og tidsrøvende øvelse, og ofte også frustrerende, fordi miljødata på den anden side har været sparsomme eller manglende, og fordi afgrænsningen af udsatte og ikke-udsatte befolkningsgrupper har været vanskelig.

Med udviklingen af Geografisk Informations Systemer (GIS) er afgrænsning i rum og tid blevet lettere, ligesom f.eks. computerbaserede forureningsmodeller kan appliceres i GIS, og forbedre afgrænsning af eksposition.

Netop afgrænsningen af befolkningsgrupper eller individer, der inden for en given tidsperiode har været udsat for en uhensigtsmæssig miljøpåvirkning, og størrelsen af denne påvirkning, er helt centrale problemstillinger, når det gælder udbyttet af samkøring af miljø- og sundhedsregistre, hvad enten det gælder udredningen af virkningen af verserende forurening, eller det drejer sig om forskning i årsags-virkningsmekanismer inden for miljømedicinen. Og netop her må det anføres, at applikation i GIS af informationer fra miljø- og sundhedsregistrene, ikke alene kan tjene som en visualisering af data, men i endnu højere grad kan tjene til vurdering af en påvirknings størrelse og udbredelse.

Nogle eksempler på værdifuld anvendelse af GIS i registerforskningen:

  1. Ved undersøgelse af dioxin-forurening fra en metalvirksomhed i Kolding 1986-19987 har brug af GIS vist sig at være en god ny metode til netop kobling af miljø- og sundhedsdatasæt og til løsning af afgrænsningsproblematikkerne. Ved denne undersøgelse har brug af en computer-modelleret spredningsmodel for luftbåren forurening fra virksomheden vist sig anvendelig og værdifuld. Samtidig har det vist sig, at problematikken omkring en befolkningsgruppes flytninger er et langt større problem end hidtil antaget – og dermed vurderingen af størrelsen af en ekstern miljøpåvirkning.
       
  2. Samme metode er anvendt i undersøgelsen foretaget på Center for Registerforskning, Århus Universitet, hvor man ville undersøge om nærhed til større veje (trafikskabt forurening) havde sammenhæng med udviklingen af schizofreni8.
       
  3. Og endelig anvendes et lignende oplæg ved den nyligt igangsatte nationale undersøgelse af eventuel sammenhæng mellem kræft hos børn og deres udsættelse for radon fra boligen. Undersøgelsen foretages af Institut for Epidemiologisk Kræftforskning, Kræftens Bekæmpelse.
       
  4. På europæisk plan er der de seneste 3 år sket et fælles udviklingssamarbejde omkring sundhedsovervågning af miljøeffekter via det EU-støttede EUROHEIS-samarbejde9. Således har UK, Finland og Sverige indført landsdækkende informationssystemer for brug af deres sundhedsregistre, og hvor brug af GIS indgår som en integreret del. Så vidt det vides, er der kun ad hoc sket samkøring med nationale miljøregistre.

    Sundhedsstyrelsens planlagte nationale geografiske sundhedsdatabase er en udløber af dette samarbejde, idet også Danmark har deltaget.

4.3 GIS Sundhed DK

Der skal i denne forbindelse specielt omtales et projekt, som Sundhedsstyrelsen har igangsat for nyligt, og som har til formål at opbygge et geografisk baseret informationssystem for det danske sundhedsvæsen, kaldet GIS Sundhed DK. Det overordnede formål er at opbygge et informationssystem til såvel central- som lokal anvendelse inden for den generelle sundhedsmæssige overvågning samt forebyggelse.

Informationssystemet tænkes også udbygget, så det med udgangspunkt i en konkret miljøbelastning (typisk over tid) i det eksterne miljø kan vurdere de sundhedsmæssige risici for den del af befolkningen, der opholder eller har opholdt sig (bopæl eller arbejder) inden for det givne område.

Informationssystemet tænkes udviklet som en portal med adgange på forskellige niveauer. Systemet skal kunne anvendes dels til at give et overblik over- samt en vurdering af de sundhedsmæssigt risici for en geografisk afgrænset population, der udsættes eller har været udsat for en konkret og identificerbar påvirkning fra det eksterne miljø. De sundhedsmæssige risici skal omfatte såvel infektionssygdomme som sygdomme med en lang latenstid som eksempelvis kræftsygdomme.

Datagrundlaget dannes ved samkøring af centrale og landsdækkende registre (databaser) inden for områderne sundhed og miljø. Herudover vil samkøringen omfatte data til beskrivelse af populationens socio-økonomiske forhold10.

For sundheds- og populationsdata findes disse på individniveau, mens data for miljøområdet er relateret til fysiske punkter eller flader. Til koblingen mellem individ- og miljødata bruges en geografisk reference (punkt, polygon). Oplysningen om opholdsadresse kobles med en adressedatabase med en geografisk reference. På samme måde geokodes oplysningerne fra det eksterne miljø. Dette muliggør efterfølgende en kobling mellem miljø- og sundhedsdata.

I første omgang er der tænkt på de centrale sygdomsregistre (Landspatientregisteret, Cancerregisteret og Dødsårsagsregisteret). Hvor det kan dreje sig om miljøpåvirkninger med meget specifikke helbredsskader kan det på sigt vise sig nødvendigt at inddrage andre registertyper så som eksempelvis kliniske kvalitetsdatabaser, databaser over specifikke sygdomme samt registreringer foretaget i primærsektoren.

Datagrundlaget giver ydermere mulighed for at foretage analyser, estimere risiko og udarbejde rapporter.

Der er på nuværende tidspunkt igangsat to pilotprojekter. Heraf omfatter det ene en samkøring af lokale vandkvalitetsdata med lokale sundhedsdata. Hensigten er at "give en generel beskrivelse af drikkevandsmiljøet, befolkningen, geografien og sygeligheden"11. Resultaterne fra disse pilotprojekter vurderes og såfremt den udviklede model viser sig anvendelig vil resultaterne blive brugt i det videre udviklingsarbejde. De igangsatte pilotprojekter forventes afsluttet i foråret 2003.

Det skal anføres, at der er tale om et skitseprojekt, hvor kun to pilotprojekter er under implementering. Gennemførelsen af hele projektet vil kræve betydelige ressourcer både økonomiske og mandskabsmæssige til afklaring af de problemstillinger nævnt i kapitel 6.

4.4 Nogle kvalitative betragtninger omkring kobling af miljø- og sundhedsdata

Midt i begejstringen over, hvad registerdata kombineret med en række tekniske landvindinger på IT-området kan frembringe, er det vigtigt også at se på nogle af de fejltagelser, der er foretaget og som skal forebygges i fremtidens samkøringsmodeller og -projekter.

Således skal omtales et stort tvær-europæisk registerstudium (med dansk deltagelse), hvor man ønskede at undersøge postulatet om, at nærhed til lossepladser har sammenhæng med en forøget hyppighed af medfødte misdannelser12. I undersøgelsen konkluderede man, at der kunne konstateres en sådan sammenhæng. Problemet var imidlertid , at man ikke anlagde nogen årsags-virkningsforklaring eller teori inden undersøgelsen, og at man inden undersøgelsen ikke klargjorde, hvad det konkret var, man ville teste, og på hvilken måde resultaterne efterfølgende skulle tolkes. Man står altså med en undersøgelse, hvor man har konstateret en sammenhæng, men ikke ved, hvad man reelt har målt på. Sammenhængen kan være tilfældig, men kan også afspejle noget reelt, men hvor dette vil kræve yderligere undersøgelser. Undersøgelsen, der højst kunne danne basis for hypoteser om mulige kausale sammenhænge, gav imidlertid anledning til betydelig bekymring – ikke mindst hos de mange mennesker, der har valgt eller er tvunget til at bo i nærheden af en eksisterende eller tidligere losseplads.

Dette illustrerer, at resultatet af en ikke-velovervejet samkøring af miljø- og sundhedsdata kan ende med at blive uanvendeligt, og endda i værste fald skadeligt.

Problemstillingen er velkendt: miljødata er ikke altid entydige/lette at tolke. Derfor skal man sikre sig, at kobling af miljø- og sundhedsdata sker på basis af kvalitativt gode miljødata, der tolkes korrekt af forskere og myndigheder. Ofte er det af stor betydning, hvordan, hvornår og på hvilken måde prøverne er taget, og hvordan de er analyseret, for den værdi, prøven repræsenterer - det være sig en måling for pesticid i grundvand, et tungmetal i jorden eller en kemisk forbindelse i luften.

Derfor er det vigtigt ved registersamkøring og analyse af resultaterne, at man mellem de involverede forskere og myndigheder forinden har aftalt et sæt spilleregler for tolkning af analysedata, for at forhindre udmeldinger, der hviler på forkert eller for spinkelt grundlag.

4.5 Nogle tekniske aspekter omkring en række centrale miljøregistre

I Miljøministeriet er en række databaser i dag ikke tilgængelige, da de er beskyttet af en effektiv firewall, men der findes muligheder for at placere databaserne eller dele af dem til områder af firewallen, hvortil der kan gives adgang.

Samkøring miljøregistrene imellem og med andre eksterne registre er i dag mulig, men det kræver et større udredningsarbejde, hvor ønsker/behov skal specificeres, og der skal, som nævnt ovenfor, aftales et sæt spilleregler.

I forbindelse med tidligere nævnte Miljøportal er man netop ved at undersøge forskellige muligheder for, hvordan data i forskellige databaser kan kobles, og hvor der i øjeblikket undersøges mulighederne i alt fra få fælles databaser til fuldt distribuerede systemer, der sammenkobles.

En fælles geografiske reference for miljøregistrene er ligeledes vigtigt at få defineret og aftalt. Det vil næppe være et problem med UTM koordinater for mange af miljøregistrene, idet disse allerede findes. For en del databaser er der defineret en såkaldt hydrologisk reference, som "entydigt" skal definere hvor en punktkilde eller en station er lokaliseret i et vandløbssystem. Dette Hydrologiske Referencesystem, som i dag ikke har tilknyttet et UTM koordinat, er ved at blive omlagt og simplificeret, og vil i fremtiden få et UTM koordinat, da det netop er hensigten, at man vil knytte disse data til kort og dermed til punktstedfæstelse.

Et væsentligt aspekt omkring miljøregistrene er også deres opdatering. De databaser, der er en del af NOVA-2003 opdateres mindst een gang om året. Amterne vil i et eller andet omfang fremover udføre en "løbende" opdatering, men en række emner vil kun blive opgjort een gang om året.

Man skal være opmærksom på, at der her ligger et kvalitetssikringsproblem, som skal tages alvorligt. Det er vigtigt at være opmærksom på den kvalitetsikring af miljødata, der sker ved passage gennem de før omtalte fagdatacentre og som er afgørende for validiteten af de nationale miljødatasamlinger.

7 Embedslægeinstitutionen for Vejle Amt, "Kræftforekomst i befolkning udsat for luftbåren dioxin", SUM-støttet projekt 2001/2002
  
8 "Distance to road as a proxy measure of pollution from traffic and the risk of schizophrenia", NCRR, 2002
  
9 EUROHEIS, A European Health and Environment Information System for Exposure and Disease Mapping and Risk Assessment. Final Report 2002, Imperial College, London.
  
10 Det skal her anføres at der i Danmarks Statistik allerede findes forskellige "færdigpakker" med koblede sundheds- og socioøkonomiske data, eksempelvis Forebyggelsesregisteret, der kobler data fra og med 1977 med følgende hovedområder for sundhed: personoplysninger om patienter, dødsårsager og lægebenyttelse, og for socio-økonomi: personoplysninger om demografi, erhverv og indkomst, uddannelse, sociale ydelser og boligforhold
  
11 Projektgrundlag, GIS i Sundhedssektoren for Drikkevandskvalitet i Viborg Amt, Sundhedsstyrelsen, marts 2002
  
12 Risk of anomalies near hazardous-waste landfills in Europe: the EUROHAZCON study, Lancet 1998; 352: 423-27