5. Validering af alternativer til øjenirritationstesten, Miljøstyrelsen

Alternativer til dyreforsøg for øjenirritation.

5. Validering af alternativer til øjenirritationstesten

Verden over er der gjort en meget stor indsats for at udvikle pålidelige alternativer til øjenirritationstests. Der er tidligere blevet gennemført en lang række mindre programmer for validering af metoderne, og senest er to store meget ressourcekrævende studier blevet iværksat af EU/Home Office og COLIPA. Hensigten med de to sidstnævnte undersøgelser var at opnå en endelig afklaring af spørgsmålet, om in vitro metoder kan fungere som erstatninger for dyreforsøg til øjenirritationstestning. Denne proces har dog været betydeligt mere kompliceret end først antaget.

EU/Home Office undersøgelsen

Undersøgelsen blev arrangeret af EU kommissionen og det britiske Home Office. Formålet med studiet var at undersøge, om 9 alternative metoder enten fuldstændigt eller delvist kunne erstatte Draize øjenirritationstesten (se tabel 5.1). I studiet fandtes der ingen signifikante overensstemmelser mellem resultater fra in vitro metoderne og Draize test MMAS værdier for 60 blandede kemiske stoffer. Der fandtes heller ikke pålidelige forudsigelser af Draize test resultater, når teststofferne opdeltes i vandopløselige stoffer (n = 30) og ikke-vandopløselige stoffer (n = 18). De alternative metoder kunne tillige ikke generelt identificere stærkt irriterende stoffer. Forudsigelser af øjenirritation foretaget med de alternative metoder havde en så ringe præcision, at resultaterne ikke skønnedes at kunne blive af praktisk betydning. Det eneste positive resultat af undersøgelsen var, at der for flere metoder opnåedes relativt gode overensstemmelser til øjenirritationsdata for 12 tensider (Balls et al., 1995).

Tabel 5.1

EU/Home Office studiets alternative metoder til test for øjenirritation

Test med røde blodlegemer

EYTEX metoden

BCOP (bovin corneal opacitet og permeabilitet) testen

HET-CAM testen

Fluorescein lækage testen

Test med isolerede kyllingeøjne

Test med isolerede kaninøjne

Silikone mikrofysiometret

Neutralrødtoptagelses testen

BGA studiet

Udfaldet af EU/Home Office studiet var ikke fuldstændig uventet. Det tyske sundhedsministerium (BGA) arrangerede tidligere en valideringsundersøgelse med 136 blandede stoffer. Konklusionen var, at der ikke fandtes nogen overensstemmelse mellem in vivo øjenirritationsdata og resultater fra en celletest med neutralrødtoptagelse. En test med fosterhinden fra hønseæg (HET-CAM testen) kunne dog identificere visse stærkt irriterende stoffer (Spielmann et al., 1993). En database med resultater fra test af 200 stoffer er senere blevet etableret. Resultater for 9 stoffer blev ekskluderet på basis af en uacceptabel kvalitet af deres in vitro data. Tillige blev resultater for 48 kemikalier udelukket med den begrundelse, at originale Draize test resultater ikke var tilgængelige. Meget præcise individuelle data fra Draize tests udført efter OECD guideline 405 i op til 21 dage (ECETOC, 1998) er dog publiceret for mere end 25% af disse stoffer, og det ville være interessant at genoptage disse stoffer i BGA databasen. Ved analyse af data for de resterede stoffer blev det fundet, at ingen af de alternative tests kunne identificere R-41 stoffer med mere end 50% sensitivitet, og en acceptabel specificitet på mere end 80% kunne kun opnås med HET-CAM testen. For 129 af de 143 resterende kemikalier var resultater fra begge in vitro tests tilgængelige, og en lineær diskriminant analyse blev foretaget på kombinerede endpoints fra de to tests. Ved brug af denne procedure fandtes en falsk-negativ rate for R-41 stoffer på 29%, og en falsk-positiv rate for andre stoffer på 22%. Klassifikationen af R-41 stoffer blev dog forbedret ved hensyntagen til stoffernes opløselighed i vand og olie (Spielmann et l., 1996).

CTFA studiet

USA’s cosmetikindustri (CTFA) gennemførte fra 1990 til 1996 et valideringsprogram med ca. 25 alternative metoder til øjenirritationstests. MAS værdier fra en LVET test blev brugt i de to første faser af programmet, og Draize MAS værdier blev brugt i den sidste fase. I begge tests bruges albino kaniner, men i LVET testen installeres der kun 10 µl af teststoffet i øjet (mod 100 µl i Draize testen). De datatransformationer, der passede bedst til in vitro/in vivo overensstemmelserne var generelt 2 eller 3 parameter logistiske modeller. HET-CAM testen, neutralrødtfrigørelsestesten og EYTEX^TMtesten gav relativt gode forudsigelser af 10 formuleringer med vand/alkohol (Gettings et al., 1996a). Ingen af de alternative tests kunne forudsige in vivo responset af 18 olie/vand emulsioner (Gettings et al., 1998). Flere tests gav dog gode forudsigelser af Draize MAS værdier for 25 tensidbaserede produkter (Gettings et al., 1996b). Variabiliteten af HET-CAM testen og neutralrødtfrigørelsestesten overskred konsistent in vivo forsøgenes variation, men de øvrige alternative tests var mere reproducerbare.

IRAG evaluering

EU/Home Office studiets resultater var også tidligere delvist bekræftet af en undersøgelse, der i 1993 blev foretaget af en arbejdsgruppe af eksperter fra forskellige regulatoriske myndigheder (IRAG). IRAG foretog en samlet vurdering af eksisterende data fra en lang række in vitro metoder på øjenirritationsområdet. 41 laboratorier verden over indsendte 55 datasæt opnået med 23 forskellige in vitro metoder til IRAG. Datasættene omfattede fra 9 til 133 teststoffer, der var anvendt i de deltagende laboratorier.

I IRAG studiet viste tests med fosterhinder fra hønseæg dårlige til moderat gode overensstemmelser til Draize test resultater for op til 93 blandede teststoffer. Med HET-CAM testen opnåedes dog gode overenstemmelser til in vivo data for tensidbaserede stoffer og produkter, og CAMVA testen viste den bedste forudsigelse for alkoholbaserede produkter (Spielmann et al., 1997). En test med øjne fra kaniner og en test med isolerede hornhinder fra koøjne (BCOP-testen) blev begge bedømt af IRAG til at have et potentiale for at identificere stærkt irriterende stoffer, men metoderne kunne ikke generelt forudsige Draize test resultater. En test med isolerede øjne fra høns og en test med isolerede linser fra koøjne viste begge gode overensstemmelser til in vivo data generelt. Datasættene for de to sidstnævnte tests var dog for begrænsede til, at metoderne fuldt ud kunne bedømmes (Chamberlain et al., 1997). IRAG bedømte tillige en række tests med cellekulturer til at have et potentiale for forudsigelse af Draize test resultater for vandopløselige stoffer ved normale pH værdier (Botham et al., 1997; Harbell et al., 1997). EYTEX testen viste en dårlig overensstemmelse til in vivo data for 454 kosmetiske indholdsstoffer og formuleringer, men forudsigelsen var god for enkelte grupper af materialer, f.eks. petrokemikalier og opløsningsmidler. Et Microtox assay med bakterier fandtes at være potentielt anvendeligt ved test af tensidbaserede produkter. SKIN² ZK1200 vævsmodellen blev vurderet som meget anvendelig til screening af kosmetiske produkter og husholdningsartikler, når måling af vævets viabilitet med MTT testen blev anvendt. Måling af udskillelse af prostaglandin E₂ som irritationsmarkør blev bedømt som problematisk. Yderligere udvikling af SKIN² ZK 1200 modellen blev anbefalet, mens brug af en vævsmodel udelukkende med fibroblaster ikke blev fundet hensigtsmæssig (Curren et al., 1997).

JMHW/JCIA studiet

Det japanske ministerium for sundhed og velfærd (JMHW) startede i 1991 en valideringsundersøgelse sammen med den japanske kosmetikindustri (JCIA), nationale forskningsinstitutioner, universiteter og test kit leverandører. 12 alternative metoder blev evalueret med 38 kosmetiske indholdsstoffer, og der blev gennemført Draize tests på de samme stoffer.

To SKIN² modeller blev anvendt, begge med en MTT test protokol. En ZK1100 fibroblastmodel blev brugt i 6-8 laboratorier. ZK1200 modellen (TEA) blev anvendt i 2 laboratorier for alle teststofferne, og i 6-7 laboratorier for 13 teststoffer. Ved brug af fibroblastmodellen blev vævene nedsænket i kulturmediet og eksponeret for teststoffer, opløst i mediet. Ved anvendelse af ZK1200 modellen, blev teststofferne påført epithelets overflade. Protokollen adskilte sig dog fra den, der blev brugt i COLIPA studiet, fordi teststofferne blev opløst eller suspenderet i mediet. T₅₀ værdier blev afledt fra MTT tids-respons grafer. En relativt høj interlaboratorie variabilitet blev observeret med begge vævsmodeller med en gennemsnitlig CV på 44.5% (n=30) med ZK1100 modellen, og en CV på 61.9 % (n=9) på eksakte t₅₀ værdier opnået med ZK1200 modellen i 6-7 laboratorier. Der var dog en total overensstemmelse mellem de to laboratorier, der testede det fulde sæt af teststoffer for 17 stoffer med cut-off værdier, og en meget god korrelation (r=0.84) blev opnået ved reanalyse af log-transformede t50 værdier for de 16 øvrige stoffer. Relativt dårlige lineære korrelationer blev fundet til Draize test MAS values både med in vitro data fra ZK1100 modellen (r=0.71) og ZK1200 modellen (r=0.63) (Kurishita et al., 1999). En reanalyse af data opnået med ZK1200 modellen i to laboratorier ved brug af den forudsigelsesmodel, der anvendtes i COLIPA studiet øgede forudsigelsen af in vivo resultaterne: Relativt gode korrelationer (r>0.78) blev herved opnået mellem observerede og forudsagte Draize test MMAS værdier. Udelukkelse af teststoffer, der var uforenelige med cellekulturmediet (syrer, baser og alkoholer med lav molekylvægt) øgede dog markant in vitro/in vivo korrelationen opnået med ZK1200 modellen (r=0.84) (Ohno et al., 1999).

En MATREX vævsmodel med humane fibroblaster dyrket i en kollagenmatrix blev også anvendt i undersøgelsen. Teststoffer blev påført ufortyndede til vævets overflade i 24 timer, og koncentrationer, der gav 50% nedsættelse af MTT responset blev bestemt (EC50 værdier). Alternativet blev der anvendt en MATREX scoring med den laveste koncentration, der reducerede vævets viabilitet med 20-80%. 12 laboratorier brugte i alt modellen, men det fulde sæt af teststoffer blev kun testet i 3 laboratorier. Den interlaboratorielle reproducerbarhed var betydeligt bedre ved brug af MATREX scoringen (CV=9.6%, n=39) end ved brug af EC50 værdier (CV=34.6%, n=33)(Ohno et al., 1999). Ensartede korrelationer (r=0.67) blev opnået mellem EC50 værdier, MATREX scoringer og Draize MAS værdier (Ohuchi et al., 1999). Det vil dog være muligt at øge metodens forudsigelsesevne betydeligt ved anvendelse af en non-lineær logistisk forudsigelsesmodel.

En dårlig korrelation (r=0.31) til Draize MAS værdier blev opnået med EYTEX testen (Matsukawa et al., 1999). Tillige blev der opnået moderate in vitro/in vivo korrelationer med en test med måling af denaturering af isoleret hæmoglobin, og de interlaboratorielle CV’er overskred 240%. En god korrelation til Draize MAS værdier (r=0.91) blev opnået ved brug af 50% denaturering som endpoint (Hatao et al., 1999). Korrelationen var dog kun baseret på test af 8 stoffer, og skyldtes sammenfald af data. Store interlaboratorielle variationer (CV’s>50%) blev også observeret med forskellige tests med hønseæg. Moderate korrelationer til Draize MAS værdier blev opnået med en CAM tryphanblåt absorptionstest (r=0.69, n=52) og HET-CAM testen (r=0.72, n=55) (Hagino et al., 1999). Det vil dog formentlig være muligt at øge HET-CAM testens forudsigelsesevne ved anvendelse af en non-lineær logistisk forudsigelsesmodel. Resultater fra forskellige cytotoksicitets-tests var moderat til godt korrelerede til Draize MAS værdier: Normale hornhindeceller fra kaniner (r=0.53, n=28), hæmolysetest med røde blodlegemer (r=0.63, n=17), mammale cellelinier (r>0.71, n=29), og SIRC hornhindeceller fra kaniner (r>0.81, n=29-30). For disse tests var den interlaboratorielle reproducerbarhed acceptabel med CV’er fra 24% til 37% (Ohno et al., 1999).

BCOP workshop, 1997

BCOP testens evne til at forudsige øjenirritation er blevet evalueret af en gruppe af forskere fra laboratorier med en stor erfaring i brug af testen. En database med in vitro resultater for mere end 200 teststoffer har vist overensstemmelser til Draize test irritationsklasser på 80-85%, og assayet har en god reproducerbarhed (Sina and Gautheron, 1998). Test af et stort antal positive kontrollet har vist en udmærket intralaboratorie reproducerbarhed med CV’er på totale BCOP scoringer fra 12% til 16% (Harbell and Curren, 1998). Fluorescein lækage testen med MDCK celler har demonstreret en meget ringe evne til at skelne mellem Draize test irritationsklasser, og målinger af fluorescein lækage gennem hornhinder er ikke vist at være prædiktivt for øjenirritation (Sina and Gautheron, 1998).

COLIPA studiet

Resultaterne af COLIPA's valideringsundersøgelse af alternativer til øjenirritationstests bekræftede generelt resultaterne fra de tidligere undersøgelser. Flertallet af de alternative metoder i COLIPA studiet fandtes ikke egnede til forudsigelse af akut øjenirritation for blandede stoffer og produkter (Brantom et al., 1997). Dette stemmer overens med konklusionen på EU/Home Office studiet, hvor ingen af de anvendte metoder viste sig egnede til erstatning af Draize testen (Balls et al., 1995). Flere in vitro metoder fandtes i COLIPA studiet egnede til at forudsige øjenirritation forårsaget af kosmetiske ingredienser, specielt af tensidbaserede produkter. I EU/Home Office studiet fandtes flere alternative tests også gode til forudsigelse af tensiders øjenirriterende effekter, og dette er tillige observeret i en række tidligere valideringsundersøgelser (Rasmussen, 1993). I COLIPA studiet havde tests med fosterhinder fra hønseæg en meget ringe reproducerbarhed. Resultater opnået med de øvrige metoder var relativt godt reproducerbare mellem forskellige laboratorier.

COLIPA studiet havde det væsentlige nye resultat, at en in vitro model, SKIN² ZK1200, blev vist at være meget god til forudsigelse af et bredt spektrum af øjenirritationsdata. Metodens reproducerbarhed må betragtes som rimelig, og den er i lighed med de fleste andre in vitro metoder betydeligt mere reproducerbar end Draize testen (Southee et al., 1999). COLIPA studiet viste dermed som den første større blindundersøgelse af blandede stoffer og produkter, at en alternativ test vil kunne erstatte dyreforsøg for akut øjenirritation. SKIN² ZK1200 metoden har tillige som den første in vitro test vist et godt potentiale for brug til vurdering af vedvarende øjenirritation. Testen har derfor vist et meget stort potentiale for at kunne fungere som en fuldstændig erstatning for dyreforsøg for øjenirritation. På grund af standsningen af produktion og salg af SKIN² modellerne er udvikling og anvendelse af alternative vævsmodeller særdeles påkrævet, hvis de eksisterende dyreforsøg for lokalirritation skal kunne erstattes med mere pålidelige alternative metoder.

Alternative vævsmodeller

Der er udviklet flere kommercielt tilgængelige øjenmodeller med væv af keratinocytter, der vokser på microporøse membraner. Modellerne omfatter en EpiOcular ^TM model og en REC model, der begge har vist potentiale for at kunne erstatte øjenirritationsforsøg. I begge modeller bliver teststofferne påført ufortyndede på overfladen af vævene, og toksiciteten bedømmes på basis af tids-respons relationer opnået med MTT assayet. Ved anvendelse af EpiOcular^TM modellen var t₅₀ værdier for 28 kemikalier fra ECETOC’s databank meget godt korrelerede (r=0.90) til Draize test scoringsværdier. Ved brug af en forudsigelsesmodel udviklet på baggrund af denne undersøgelse, fandtes der en god korrelation (r=0.87) mellem forudsagte og observerede Draize scoringsværdier for 41 færdige produkter (Sheasgreen et al., 1996). Tillige er der fundet en relativt god overensstemmelse mellem t₅₀ værdier for 43 prøver omfattende væsker, pulvere og geler opnået med EpiOcular^TM modellen og Draize test klassifikationer (Stern et al., 1998). Der er senere udviklet en 2 parameter logistisk forudsigelsesmodel for MTT data opnået med EpiOcular^TMvæv på basis af in vitro/in vivo data for 19 vandopløselige keimkalier og 41 færdige produkter, og en god korrelation (r=0.90) blev opnået mellem forudsagte og observerede Draize MMAS værdier. Ved brug af forudsigelsesmodellen fandtes der tillige en god forudsigelse af Draize MMAS værdier (r=0.89) for 11 færdige produkter. Reproducerbarheden af MTT testen med EpiOcular^TM modellen er god. På basis af test af 132 prøver fandtes gennemsnitlige CV’er på ca. 5% med negative kontroller, og på 25% med en positiv kontrol (0.3% Triton X-100) (Klausner et al., 1999).

REC modellen ligner meget EpiOcular^TM modellen, og en god korrelation (r=0.89) er opnået mellem MTT test data fra REC modellen og Draize test MMAS værdier for 40 kosmetiske formuleringer, der dækkede et bredt spektrum af irritationsskalaen. Tillige er der fundet acceptable CV’er i et reproducerbarhedsstudie med 1% SLS (n=12, CV=18%) og et tensidbaseret produkt (n=15, CV=24%) (Doucet et al., 1998).

[Forside] [Indhold] [Forrige] [Næste] [Top]