Bilag A: Box-Cox funktionen, Miljøstyrelsen

Hvad koster støj?

Bilag A: Box-Cox funktionen

Fortolkning af modeller og parameterestimater

En meget fleksibel funktionel form er den kvadratiske Box-Cox funktion. Cropper et al. (1988) har dog vist, at relativt simple funktionelle former (lineær, semi-logaritmisk, dobbelt-logaritmisk samt invers semi-logaritmisk) samt den lineære Box-Cox funktion har vist sig at være mest robuste over for fejlspecifikationer i modellen. Man kan vælge at transformere de enkelte variabler med forskellige transformationsparametre eller bruge den samme transformationsparameter for alle. Det anbefales ofte at bruge at bruge en separat estimator for miljøparameteren (Palmquist, 1991, Tyrväinen og Miettinen (2000)

Den optimale værdi af transformationsparameteren lambda(?l ) kan findes, hvor -2*log-likehoodværdien plottet mod l har minimum. Det vil derefter ofte være relevant at teste om den lambdaværdi, der fremkommer, ligeså vel kunne have været 0 eller 1, da disse lambdaværdier giver let tolkelige modeller³². Det er problematisk at tolke en model med en lambdaværdi på eksempelvis 0,14.

I denne undersøgelse bruges Box-Cox funktionen som et redskab til at finde den mest hensigtsmæssige simple funktionelle form. Hovedformålet er ikke at finde den mest optimale funktionelle form, men at bruge Box-Cox funktionen til at vælge mellem de funktionelle former, der giver en fornuftig tolkning af parameterestimaterne.

Palmquist og Danielson (1989) viser brugen af en anden lidt simplere metode, der er ækvivalent med brug af Box-Cox funktionen, når man på forhånd har lagt sig fast på at vælge en simpel funktionel form. Først transformeres den afhængige variabel med transformationsparameteren. Når transformationen for denne variabel er valgt estimeres der modeller, hvor de forklarende variabler holdes utransformeret hhv. transformeres logaritmisk. Holdes afstandsparameteren separat resulterer dette i fire 4 modeller, hvor det at minimere residualernes kvadratsum (RSS) svarer til at maksimere Log-likelihood funktionen.

Denne metode har den fordel, at den på en enkel måde giver mulighed for at transformere den afhængige og de forklarende variabler forskelligt. Mulighedsfeltet er som udgangspunkt fire funktionelle former (lineær, dobbelt-logaritmisk, semi-logaritmisk, invers semi-logaritmisk) og med afstands-parameteren separat transformeret giver det fire gange to, dvs. otte forskellige funktionelle former.

Denne fremgangsmåde bruges i denne undersøgelse.

Fortolkning af modeller og parameterestimater

Ved kun at tillade at variablerne kan transformeres logaritmisk eller holdes utransformeret, er der grundlæggende fire mulige sammenhænge mellem den afhængige variabel og de forklarende variabler. Da miljøparameteren tillades en separat transformation kan sammenhængen mellem den afhængige variabel og de enkelte forklarende variabler være forskellige.

Lineær sammenhæng.

Her er både den afhængige og den forklarende variabel utransformeret. Dette betyder, at sammenhængen mellem f.eks. huspris og boligareal kan udtrykkes som en fast kvadratmeterpris uanset husets størrelse og pris.

Semi-logaritmisk sammenhæng.

Her er den afhængige variabel transformeret logaritmisk, mens den forklarende variabel er utransformeret. Dette betyder, at en absolut ændring i f.eks. boligareal resulterer i en procentvis ændring i husprisen.

Invers semi-logaritmisk sammenhæng.

Her er den forklarende variabel transformeret logaritmisk, hvorimod den afhængige variabel er utransformeret. Dette betyder, at en procentvis ændring i boligareal giver en absolut ændring i husprisen. Det betyder altså, at f.eks. kvadratmeterprisen er marginalt aftagende.

Dobbelt-logaritmisk sammenhæng.

Her er både den afhængige og de forklarende variabler transformeret logaritmisk. Dette betyder, at parameterestimaterne kan tolkes som elasticiteter, f.eks. medfører en procentvis ændring i boligareal en procentvis ændring i husprisen.

De fire sammenhænge/modeller danner planer i hhv. lineære; log/lineære; lineær/log og log/log koordinatsystemer.

³²	I dette test sammenlignes likelihoodratioværdien med 2- fordelingen med 2 frihedsgrader. Likelihoodratio =2*(LogL1-LogL2)