Miljøprojekt, 1046 – Værditab ved salg af forurenede eller tidligere forurenede ejendomme med helårsbeboelse

Værditab ved salg af forurenede eller tidligere forurenede ejendomme med helårsbeboelse

3 Metode og data

3.1 Statistiske begreber
3.2 Værktøjer
3.3 Arbejdsgang
3.4 Hypoteser

3.1 Statistiske begreber

3.1.1 Middel- og medianværdi og normalfordeling

Gennemsnittet eller middelværdien beregnes ved at summere alle værdier og dividere med antallet af disse. Medianværdien angiver værdien af den observation, der er lige midt i datamængden, dvs. at 50 % af værdierne er højere og 50 % er lavere end denne værdi. Enkelte ekstreme værdier påvirker ikke en medianværdi i nær samme grad, som tilfældet er ved beregning af middelværdi.

3.1.2 Variansanalyse

En variansanalyse er et forsøg på at beskrive ens observationer som en kombination af faktorer, målt eller givet sammen med den enkelte observation. I den aktuelle analyse betragtes udelukkende kategoriserende faktorer, f.eks. depotstatus, handelsår, landsdel o.l.

Den til grundliggende model for variansanalysen beskriver en given observation som en lineær sum af bidrag fra de enkelte faktorer, fra vekselvirkninger mellem faktorerne og endelig fra tilfældig variation.

Under variansanalysen opsplittes den totale variation i datamaterialet i de bidrag, som kommer fra de enkelte variationskilder (faktorerne etc.) og opstilles i en såkaldt variansanalysetabel. Ved at sammenligne variansbidragene med hinanden, kan man teste, om en given faktor er af betydning for modellen.

Testene gennemføres rent formelt ved, at man opstiller den hypotese, som skal afprøves nulhypotesen.

Nulhypotesen er normalt en antagelse om lighed (f.eks. ingen effekt af depotstatus og testes ved at udregne en testor (i variansanalysen lig med en F-værdi) med en tilhørende test-sandsynlighed (P).

P udtrykker, hvor sandsynligt det er at få den givne testorstørrelse under antagelse af, at nulhypotesen er sand. Normalt forkaster man nulhypotesen, hvis P er mindre end 10 % og taler da om signifikans.

Ved signifikansniveauet for en test forstås således sandsynligheden for at forkaste hypotesen, når den er sand.

Et signifikant resultat for en af faktorerne betyder derfor, at mindst en af faktorens kategorier afskiller sig fra de øvrige. Hvilke kategorier der adskiller sig, kan derefter påvises ved parvise sammenligninger kategorierne imellem.

Variansanalysen forudsætter, at de enkelte observationer (f.eks. handelspris) er uafhængige (krav om uafhængighed), dvs. at værdien af den ene observation ikke har nogen indflydelse på værdien af en anden observation. Ligeledes antages det, at observationerne inden for hvert niveau af faktorerne er normalfordelte og har samme varians, varianshomogenitet. Det er vanskeligt at teste for uafhængighed, mens der findes forskellige mål og test for opfyldelse af kravet om normal-fordeling, (skewness og kurtosis) samt varianshomogenitet, (Levenes Test).

Skævhed eller skewness er et mål for en fordelings asymmetri. Normalfordelingen er symmetrisk og har en skewnessværdi på 0. En fordeling med en signifikant positiv skewness har en lang højre hale. Kurtosis er et mål for fordelingskurvens stejlhed. Ved en kurtosisværdi på 0 følges normalfordelingen.

Variansanalysen er temmelig robust over for afvigelser fra normalitetskravet, mens kravet om uafhængighed og varianshomogenitet er væsentlige for fortolkningen af testresultaterne. Uanset opfyldte forudsætninger kan variansanalysen altid anvendes til at klarlægge variationskilderne i data.

Resultaterne af variansanalyserne præsenteres med en estimeret middelværdi og et tilhørende konfidensinterval. Konfidensintervallet er et interval, hvis størrelse afhænger af, hvilken sikkerhed der ønskes, og hvilken usikkerhed man kan acceptere. Et konfidensinterval på 90 % betyder således, at værdierne af en stikprøve med 90 %'s sandsynlighed vil ligge inden for intervallet.

3.1.3 Stem and leaf plot

I et datasæt kan der være observationer, som ligger meget langt fra de øvrige værdier i datasættet. Disse værdier kaldes afvigere eller outliers. Stem and Leaf- analyser resulterer i semigrafisk plot, der gør det muligt at identificere afvigende værdier.

3.2 Værktøjer

Til den statistiske analyse er anvendt SPSS version 13 /4/.

3.3 Arbejdsgang

Gennemførelsen af statistiske analyser er oftest en iterativ proces, hvor der løbende sker fortolkning og tilpasning af datagrundlag og model (Figur 3-1).

Figur 3-1 Iterativ arbejdsproces.

Figur 3-1 Iterativ arbejdsproces.

* Normalt er der tale om at reducere modellen til simplere form, og tilhørende nulhypotese udtrykker dette ved at lægge op til test for lighed.

3.4 Hypoteser

Som nævnt i afsnit 2.3.3 er det valgt at anvende den logaritmerede relative handelspris (lnRH) som undersøgelsesvariabel i modelkørslerne.

Efter en indledende vurdering af datamængden, kvaliteten og en række foreløbige beregninger førte den iterative proces, som beskrevet i Figur 3-1, til formulering af følgende hypoteser:

Hypotese 1:

Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus, og hvilken landsdel ejendommen er placeret i.

Hypotese 2:

Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus og ejendommens zonestatus (by- og landzone).

Hypotese 3:

Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus, og hvilken boligtype ejendommen har (parcelhus, lejlighed mv.).

Hypotese 4:

Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus, og den ordning som jordforureningen håndteres efter (Lov om forurenet jord, Oliebranchens Miljøpulje eller Værditabsordningen).

Hypotese 5:

Der er en sammenhæng mellem en ejendoms relative handelspris i forbindelse med gensalg og en eventuel ændret depotstatus for ejendommen.

De 5 hypoteser samt beskrivelsen af datasæt, som testes, er beskrevet i efterfølg-ende afsnit, og resultaterne fremgår af kapitel 4.

3.4.1 Beskrivelser af hypoteser og modeller

For alle modeller anvendes et signifikansniveau på 10 %. Tilsvarende anvendes et 90 %'s niveau til konfidensintervaller på middelværdier.

3.4.1.1 Hypotese 1: Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus, og hvilken landsdel ejendommen er placeret i.

Nulhypotesen (H₀) kan formuleres som:

”Uanset område er der ikke signifikant forskel på lnRH for boligejendomme med flg. depotstatus: 1) Mistanke, 2) Forurenet, 3) Oprenset, 4) Restforurening, 5) Afmeldt (Undersøgt uden fund) og 6) Ikke forurenet.

Den statistiske model kan opstilles som:

Χ_ij = µ + α_i + β_j + αβ_ij + ε_ij

hvor parametrene jf. Tabel 3-1, er:

Χ_ij = lnRH for den i'te depotstatus og j'te område	1..n
α_i = effekten af den i'te depotstatus	1..6
β_j = effekten af det j'te område	1..3
ε_ij = tilfældig residual variation	N(0,σ²)

Alle faktorer indgår i modellen med systematiske virkninger. Χ_ij antages at være uafhængige. ε_ij antages at være normalfordelte.

Nulhypotesen kan udtrykkes som:

H₀: α_i = β_j = 0

Tabel 3-1 Hypotese 1 – Faktorer og niveauer

Faktorer	Niveauer
1. Depotstatus (i)	1. Mistanke ROKA: V1 (07) OM: indtastet (01), prioriteret (02) 2. Forurenet ROKA: registreret (01), nyere forurening (04), V2 (08), oprydning iværksat (12), V1/V2 kortlagte (13), undersøgelse iværksat (14) VTO: bortfaldskode (bortfald, blank) 3. Oprenset/afmeldt ROKA: afmeldt (02), udgået (03), nyere forurening- ryddet op (05), forurening opryddet efter adl (06), udgået af kortlægning (09), ryddet op inden kortlægning (10), afmeldt efter adl (11) OM: ** VTO: bortfaldskode (afmeldt, frigivet) 4. Restforurening ROKA: registreret (01), V2 (08), V1/V2-kortlagte (13)* OM:* VTO: dato for tilbagebetaling af egenbetaling (Egenbetaling retur) 5. Afmeldt (undersøgt men uden fund) ROKA: udgået af kortlægning (09), OM: hjemsendt (04) 6. Ikke forurenet ”Rene” ejendomme fra ToldSkat i samme vurderingskreds
2. Geografi (j)	Område a) ToldSkats kommunegruppe 1, 2, 3 omfattende Københavns Kommune, Frederiksberg Kommune, Københavns Amt, Frederiksborg Amt, Roskilde Amt b) Øvrige Sjælland og øerne c) Jylland

*) ved gennemført afværge.
**) undersøgt men forurening ikke påvist.
***) OM-koden ”afsluttet” kode(03) i OM-databasen omfatter både oprensede grunde og grunde med restforurening. I alt 2.419 OM-sager I 2003 har kode (03). Effekten af restforurening belyses således kun for sager i ROKA og VTO-registret.

3.4.1.2 Hypotese 2: Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus og ejendomens zonestatus (by- og landzone).

Nulhypotesen (H₀) kan formuleres som:

”Uanset zonestatus er der ikke signifikant forskel på lnRH for boligejendomme med flg. depotstatus: 1) Mistanke, 2) Forurenet, 3) Oprenset, 4) Restforurening, 5) Afmeldt og 6) Ikke forurenet.”

Den statistiske model kan opstilles som:

Χ_ij = µ + α_i + β_j + αβ_ij + ε_ij

hvor parametrene jf. Tabel 3-2, er:

Χ_ij = lnRH for den i'te depotstatus og j'te zonestatus	1..n
α_i = effekten af den i'te depotstatus	1..6
β_j = effekten af det j'te zonestatus	1..3
ε_ij = tilfældig residual variation	N(0,σ²)

Alle faktorer indgår i modellen med systematiske virkninger. Χ_ij antages at være uafhængige. ε_ij antages at være normalfordelte.

Nulhypotesen kan udtrykkes som:

H₀: α_i = β_j = 0

Tabel 3-2 Hypotese 2 – Faktorer og niveauer

Faktorer	Niveauer
1. Depotstatus (i)	1. Mistanke ROKA: V1 (07) OM: indtastet (01), prioriteret (02) 2. Forurenet ROKA: registreret (01), nyere forurening (04), V2 (08), oprydning iværksat (12), V1/V2 kortlagte (13), undersøgelse iværksat (14) VTO: bortfaldskode (bortfald, blank) 3. Oprenset/afmeldt ROKA: afmeldt (02), udgået (03), nyere forurening- ryddet op (05), forurening opryddet efter adl (06), udgået af kortlægning (09), ryddet op inden kortlægning (10), afmeldt efter adl (11) OM: ** VTO: bortfaldskode (afmeldt, frigivet) 4. Restforurening ROKA: registreret (01), V2 (08), V1/V2-kortlagte (13)* OM:* VTO: dato for tilbagebetaling af egenbetaling (Egenbetaling retur) 5. Afmeldt (undersøgt men uden fund) ROKA: udgået af kortlægning (09), OM: hjemsendt (04) 6. Ikke forurenet ”Rene” ejendomme fra ToldSkat i samme vurderingskreds
2. Geografi (j)	Zonestatus a) Byzone b) Landzone

* )ved gennemført afværge.
**) undersøgt, men forurening ikke påvist.
***) OM-koden ”afsluttet” kode(03) i OM-databasen omfatter både oprensede grunde og grunde med restforurening. I alt 2.419 OM-sager I 2003 har kode (03). Effekten af restforurening belyses således kun for sager i ROKA og VTO-registret.

3.4.1.3 Hypotese 3:Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus, og hvilken boligtype ejendommen har (parcelhus, lejlighed mv.).

Nulhypotesen (H₀) kan formuleres som:

”Uanset boligbenyttelse er der ikke signifikant forskel på lnRH for boligejendomme med flg. depotstatus: 1) Mistanke, 2) Forurenet, 3) Oprenset, 4) Restforurening, 5) Afmeldt og 6) Ikke forurenet.

Den statistiske model kan opstilles som:

Χ_ij = µ + α_i + β_j + αβ_ij + ε_ij

hvor parametrene, jf. Tabel 3-3, er:

Χ_ij = lnRH for den i'te depotstatus og j'te område boligbenyttelse	1..n
α_i = effekten af den i'te depotstatus	1..6
β_j = effekten af det j'te boligbenyttelse	1..3
ε_ij = tilfældig residual variation	N(0,σ²)

Alle faktorer indgår i modellen med systematiske virkninger. Χ_ij antages at være uafhængige. ε_ij antages at være normalfordelte.

Nulhypotesen kan udtrykkes som:

H₀: α_i = β_j = 0

Tabel 3-3 Hypotese 3 – Faktorer og niveauer

Faktorer	Niveauer
1. Depotstatus (i)	1. Mistanke ROKA: V1 (07) OM: indtastet (01), prioriteret (02) 2. Forurenet ROKA: registreret (01), nyere forurening (04), V2 (08), oprydning iværksat (12), V1/V2 kortlagte (13), undersøgelse iværksat (14) VTO: bortfaldskode (bortfald, blank) 3. Oprenset/afmeldt ROKA: afmeldt (02), udgået (03), nyere forurening- ryddet op (05), forurening opryddet efter adl (06), udgået af kortlægning (09), ryddet op inden kortlægning (10), afmeldt efter adl (11) OM: ** VTO: bortfaldskode (afmeldt, frigivet) 4. Restforurening ROKA : registreret (01), V2 (08), V1/V2-kortlagte (13)* OM:* VTO: dato for tilbagebetaling af egenbetaling (Egenbetaling retur) 5. Afmeldt (undersøgt men uden fund) ROKA: udgået af kortlægning (09), OM: hjemsendt (04) 6. Ikke forurenet ”Rene” ejendomme fra ToldSkat i samme vurderingskreds
2. Geografi (j)	Boligbenyttelse jf. Told og Skat a) Parcelhuse, rækkehuse, to- og trefamiliehuse, dobbelthuse, udlejningsejendomme (kode 01) samt ejerlejligheder i rækkehuse (kode 27) (boliger med have) b) Ejerlejligheder i etagebeboelse (kode 21) (boliger uden have)

3.4.1.4 Hypotese 4: Der er sammenhæng mellem en ejendoms relative handelspris, ejendommens depotstatus, og den ordning som jordforureningen håndteres efter (Lov om forurenet jord, Oliebranchens Miljøpulje og Værditabsordningen).

Det testes, om RH afhænger af, hvilken ordning en forurenet/tidligere forurenet ejendom er under hhv.:

Forureningskortlægning, jf. Lov om forurenet jord (ROKA)
Oliebranchens Miljøpulje (OM)
Værditabsordningen (VTO).

Nulhypoteseen (H₀) kan formuleres som:

”Uanset ordning er der ikke signifikant forskel på lnRH for boligejendomme med flg. depotstatus: 1) Mistanke, 2) Forurenet, 3) Oprenset, 4)Restforurening, og 5) Afmeldt.

Den statistiske model kan opstilles som:

Χ_ij = µ + α_i + β_j + αβ_ij + ε_ij

hvor parametrene, jf. Tabel 3-4, er:

Χ_ij = lnRH for den i'te depotstatus og j'te ordning	1..n
α_i = effekten af den i'te depotstatus	1..6
β_j = effekten af det j'te ordning	1..3
ε_ij = tilfældig residual variation	N(0,σ²)

Alle faktorer indgår i modellen med systematiske virkninger. Χ_ij antages at være uafhængige. ε_ij antages at være normalfordelte.

Nulhypotesen kan udtrykkes som:

H₀: α_i = β_j = 0

Tabel 3-4 Hypotese 4 - Test af ordninger

Faktorer	Niveauer
1. Depotstatus (i)	1. Mistanke ROKA: V1 (07) OM: indtastet (01), prioriteret (02) 2. Forurenet ROKA: registreret (01), nyere forurening (04), V2 (08), oprydning iværksat (12), V1/V2 kortlagte (13), undersøgelse iværksat (14) VTO: bortfaldskode (bortfald, blank) 3. Oprenset/afmeldt ROKA: afmeldt (02), udgået (03), nyere forurening- ryddet op (05), forurening opryddet efter adl (06), udgået af kortlægning (09), ryddet op inden kortlægning (10), afmeldt efter adl (11) OM: ** VTO: bortfaldskode (afmeldt, frigivet) 4. Restforurening ROKA: registreret (01), V2 (08), V1/V2-kortlagte (13)* OM:* VTO: dato for tilbagebetaling af egenbetaling (Egenbetaling retur) 5. Afmeldt (undersøgt men uden fund) ROKA: udgået af kortlægning (09), OM: hjemsendt (04) 6. Ikke forurenet ”Rene” ejendomme fra ToldSkat i samme vurderingskreds
2. Ordning (j)	1. Forureningskortlægning jf. Jordforureningsloven/ registreret i ROKA (ekskl. OM-sager, VTO-sager) 2. OM 3. VTO

3.4.1.5 Hypotese 5: Der er en sammenhæng mellem en ejendoms relative handelspris i forbindelse med gensalg og en eventuel ændret depotstatus for ejendommen.

Datamaterialet omfatter ejendomme, som har været solgt under forskellige depotstatuskoder i perioden 1996-2003. Med hypotese 5 ønskes effekten af ændringer i depotstatus i perioden 1996-2003 belyst på lnRH.

Nulhypotesen (H₀) kan formuleres som:

”Ændringer i depotstatus ved gensalg fører ikke til signifikante forskelle på lnRH”.

Den statistiske model kan opstilles som:

Χ_ij = µ + α_i + ε_ij

hvor faktorerne, jf. Tabel 3-5, er:

Χ_ij = lnRH for den i'te depotstatus og j'te ordning	1..n
α_i = effekten af den i'te depotstatus	1..6
ε_ij = tilfældig residual variation	N(0,σ²)

Alle faktorer indgår i modellen med systematiske virkninger. Χ_ij antages at være uafhængige. ε_ij antages at være normalfordelte. Modellen køres i seks omgange svarende til hver type af depotændring, jf. 3.4.5.5.

Nulhypotesen kan udtrykkes som:

H₀: α_i= 0

Tabel 3-5 Hypotese 5 - Test af depotstatusændring ved gensalg

Faktorer

Niveauer

1. Depotstatus
(i)

1. Mistanke
ROKA: V1 (07)
OM: indtastet (01), prioriteret (02)
2. Forurenet
ROKA: registreret (01), nyere forurening (04), V2 (08), oprydning iværksat (12), V1/V2 kortlagte (13), undersøgelse iværksat (14)
VTO: bortfaldskode (bortfald, blank)
3. Oprenset/afmeldt
ROKA: afmeldt (02), udgået (03), nyere forurening- ryddet op (05), forurening opryddet efter adl (06), udgået af kortlægning (09)*, ryddet op inden kortlægning (10), afmeldt efter adl (11)
OM: ***
VTO: bortfaldskode (afmeldt, frigivet)
4. Restforurening
ROKA: registreret (01)*, V2 (08)*, V1/V2-kortlagte (13)*
OM:***
VTO: dato for tilbagebetaling af egenbetaling (Egenbetaling retur)
5. Afmeldt (undersøgt men uden fund)
ROKA: udgået af kortlægning (09)**,
OM: hjemsendt (04)

* ved gennemført afværge.
** undersøgt, men forurening ikke påvist.
*** OM-koden ”afsluttet” kode(03) i OM-databasen omfatter både oprensede grunde og grunde med restforurening. I alt 2.419 OM-sager I 2003 har kode (03). Effekten af restforurening belyses således kun for sager i ROKA og VTO-registret.

3.4.2 Generelle og modelspecifikke kriterier for dataudtræk

Forud for hver modelkørsel er der foretaget et udtræk af handler fra projektdatabasen på baggrund af dels nogle generelle, og dels, i de fleste tilfælde, nogle modelspecifikke kriterier.

De generelle kriterier, der gælder alle datasæt omfatter:

Frie handler i modsætning til familiehandel, auktion samt andre typer handler. Frie handler svarer til handler mellem parter med modstridende interesser mht. handelsprisen, mens der for de øvrige handelstyper er risiko for, at andre og for os ukendte forhold, påvirker handelsprisen.
Hel ejendomsoverdragelse i modsætning til delvis ejendomsoverdragelse. Idet ejendomsvurderingen altid følger hele ejendommen, giver det ingen mening at relatere handelsprisen for en del af ejendommen til ejendomsvurderingen for hele ejendommen.
Handler, hvor såvel handelspris som ejendomsvurdering er større end 0. Relative handelsværdier på 0 er hermed udelukket.
Handler med depotstatus 1, 2, 3, 4, 5 og 6, jf. afsnit 2.4.1.

De modelspecifikke kriterier fremgår af beskrivelserne for hver hypotese i afsnit 3.4.4.

3.4.3 Filtrering af afvigende observationer

Det er valgt at anvende SPSS's Stem-Leaf analyse til udvælgelse af afvigende observationer. Stem-Leaf-analysen og den deraf følgende filtrering udføres for hver hypotese og depotstatus.

Udvælgelsen foregår ved først at udføre en deskriptiv analyse, og herunder Stem-Leaf analysen, på det datasæt, der opfylder såvel de generelle som de modelspecifikke kriterier. Disse oplysninger fremgår af bilag C under overskriften ”alle observationer”. På grundlag af Stem-Leaf-plottet udvælges herefter de ikke-afvigende observationer, hvorefter der igen køres en deskriptiv analyse af det filtrerede datasæt. Disse oplysninger fremgår ligeledes af bilag C under overskriften ”Afskåret med depotstatusvis Stem-Leaf-plot”.

Som eksempel ses for depotstatus 1 (mistanke) for hypotese 1, at de afvigende observationer er som følger:

lnRH <= -0,47 (110 observationer)

lnRH >= 0,74 (126 observationer).

Ovenstående svarer til, at der er foretaget 110 handler til under 47 % af vurderingen og 126 handler til mere end 74 % over vurderingen. Der tabes således i alt 236 observationer ved filtreringen.

Filtreringen af data medfører generelt en væsentlig forbedring af variansanalysens forudsætninger vedr. normalfordelte residualer samt varianshomogenitet.

3.4.4 Generelle betragtninger vedr. forudsætninger for variansanalyserne

Variansanalyserne forudsætter som nævnt i afsnit 3.1.2:

Uafhængige observationer (handler)
Normalfordelte residualer
Varianshomogenitet.

Generelt er antagelsen om uafhængige observationer (handler) vanskelig at teste. Man kan dog argumentere for, at den enkelte handel i de fleste tilfælde er uafhængig af de øvrige handler. Handler inden for et meget begrænset område (f.eks. nabogrunde) kan dog i et vist omfang have gensidig indflydelse på lige fod med gensalg, men ellers forventes antagelsen generelt at være opfyldt.

Det er muligt at udføre en formel test for normalitet. Da variansanalyser generelt er robuste over for afvigelser i normalitet vurderes forudsætningens opfyldelse primært på grundlag af ændringen i skewness og kurtosis fra det ufiltrerede til det filtrerede datasæt samt på baggrund af histogrammer over lnRH for hver depotstatus. En skewness og kurtosisværdi på mellem -2 og 2 er her anvendt som et acceptabelt niveau.

Antagelsen om varianshomogenitet vurderes på grundlag af Levenes test. Testen er konservativ på den måde, at der kun skal små forskelle i varians til en signifikant afvisning af hypotesen om varianshomogenitet. Såfremt der ikke er varianshomogenitet kan selve testniveauet for modelhypotesen som nævnt være usikkert. Ved meget signifikante testniveauer er det dog sandsynligt, at modellen stadig vil være signifikant selv ved manglende opfyldelse af homogenitetskravet. Dette blev f.eks. bekræftet gennem en ikke parametrisk analyse på rankbaserede RH-værdier for hypotese 1. For de øvrige hypoteser vil det ligeledes være muligt at bekræfte signifikansniveauet ved ikke parametriske analyser, hvilket dog ikke er gjort her, idet det forventes at vise samme resultat som for hypotese 1.

3.4.5 Beskrivelse af datagrundlag samt forudsætninger for de enkelte variansanalyser

3.4.5.1 Hypotese 1

Datagrundlag og forudsætning for model

Til belysning af hypotese 1 er samtlige observationer, der opfylder de generelle kriterier anvendt. Der er således ikke anvendt modelspecifikke kriterier for hypotese 1.

Antallet af observationer samt andre deskriptive parametre for det ufiltrerede og filtrerede datasæt fremgår af bilag C1.

Filtreringen medfører en væsentlig reduktion i spredningen samt kurtosis/skewness inden for hver depotstatus svarende til, at forudsætningerne forbedres markant.

I alt 693 ud af 6.925 handler med relation til forurening filtreres bort, svarende til ca. 10 %.

Forudsætningerne for variansanalysen er opfyldte med tilstrækkelig tilnærmelse til at gennemføre den statistiske analyse.

3.4.5.2 Hypotese 2

Datagrundlag og forudsætning for model

Til belysning af hypotese 2 er flg. modelspecifikke kriterier anvendt ved udtræk fra projektdatabasen:

Handler med angivelse af zonestatus. Der er uddraget en to-delt zonestatus (Zonestatus) på baggrund af ToldSkats zonekode (zonekod), jf. Tabel 3-6.

Tabel 3-6 To-delt zonestatus i forhold til projektdatabasens zonestatus

Projektdatabasens zonekode	Beskrivelse	Zonestatus (model)
1	Byzone	Byzone
2	Landzone	Landzone
3	Sommerhusområde	Landzone
4	Byzone og landzone	Landzone
5	Sommerhusområde og landzone	Landzone
6	Byzone og sommerhusområde	Landzone
7	Byzone, landzone og sommerhusområde	Landzone

Antallet af observationer samt andre deskriptive parametre for det ufiltrerede og filtrerede datasæt fremgår af bilag C2.

Filtreringen medfører en væsentlig reduktion i spredningen samt kurtosis/skewness inden for hver depotstatus, svarende til, at forudsætningerne forbedres markant.

I alt 513 ud af 5.420 handler med relation til forurening filtreres bort, svarende til ca. 9 %.

Forudsætningerne for variansanalysen er opfyldte med tilstrækkelig tilnærmelse til at gennemføre den statistiske analyse.

3.4.5.3 Hypotese 3

Datagrundlag og forudsætning for model

Til belysning af hypotese 3 er flg. modelspecifikke kriterier anvendt ved udtræk fra projektdatabasen:

Boligejendomme, ekskl. andelsboliger og ejerlejligheder i en-, to- eller trefamiliehuse o.lign., (ToldSkat benytkod = 01, 27 og 21), jf. Tabel 3-7.

Tabel 3-7 ToldSkats boligbenyttelseskode

ToldSkat- boligbenyt- telseskode	Beskrivelse
01	Parcelhuse, rækkehuse, to- og trefamiliehuse, dobbelthuse, udlejningsejendomme
21	Ejerlejligheder i etagebeboelse
26	Ejerlejligheder i en, - to eller trefamiliehuse o.lign.
27	Ejerlejligheder i rækkehuse
31	Støttede andelsboliger

Antallet af observationer samt andre deskriptive parametre for det ufiltrerede og filtrerede datasæt fremgår af bilag C3.

Filtreringen medfører en væsentlig reduktion i spredningen samt kurtosis/skewness inden for hver depotstatus, svarende til, at forudsætningerne forbedres markant.

I alt 671 ud af 6.771 handler med relation til forurening filtreres bort, svarende til ca. 10 %.

Forudsætningerne for variansanalysen er opfyldte med tilstrækkelig tilnærmelse til at gennemføre den statistiske analyse.

3.4.5.4 Hypotese 4

Datagrundlag og forudsætning for model

Til belysning af hypotese 4 er samtlige observationer, der opfylder de generelle kriterier, anvendt.

Antallet af observationer samt andre deskriptive parametre for det ufiltrerede og filtrerede datasæt fremgår af bilag C4.

Filtreringen medfører en væsentlig reduktion i spredningen samt kurtosis/skewness inden for hver depotstatus svarende til, at forudsætningerne forbedres markant.

I alt 688 ud af 6.925 handler med relation til forurening filtreres bort, svarende til ca. 10 %.

Forudsætningerne for variansanalysen er opfyldte med tilstrækkelig tilnærmelse til at gennemføre den statistiske analyse.

3.4.5.5 Hypotese 5

Datagrundlag og forudsætning for model

Til belysning af hypotese 5 er samtlige observationer, der opfylder de generelle kriterier, anvendt. Dertil kommer, at kun handler, der vedrører ejendomme, der optræder under forskellige depotstatuskoder i perioden, er medtaget.

Tabel 3-8 giver en oversigt over antallet af ejendomme og handler, der er omfattet af forskellige ændringer i depotstatus gennem perioden 1996-2003. Der var ingen ejendomme, der gennemgik mere end 2 depotændringer.

Pga. antallet af observationer testes hypotesen ikke for typerne

”Mistanke til oprenset”.
”Forurenet til undersøgt uden fund”.

Antallet af observationer samt andre deskriptive parametre for de ufiltrerede og filtrerede datasæt fremgår af bilag C5a til bilag C5d.

Tabel 3-8 Type af depotændring samt antal ejendomme og antal handler

Depotændring	Antal ejd.nr.	Antal handler
Mistanke til forurenet heraf mistanke heraf forurenet	17 (9, 4, 4)*	42 19 23
Mistanke til oprenset heraf mistanke heraf oprenset	1 (0,0,1)*	2 1 1
Mistanke til undersøgt uden fund heraf mistanke heraf undersøgt uden fund	28 (15, 6, 7)*	59 29 30
Forurenet til oprenset heraf forurenet heraf oprenset	40 (29, 4, 7)*	92 42 50
Forurenet til restforurening heraf forurenet heraf restforurening	56 (43, 4, 9)*	130 67 63
Forurenet til undersøgt uden fund heraf forurenet heraf undersøgt uden fund	1 (0,0,1)*	3 1 2

*(fordeling til hhv. København/omegn, Øvrig Sjælland/Fyn og Jylland).

3.4.6 Opsummering af anvendte kriterier og forudsætningerne for variansanalyserne

Der er i undersøgelsen valgt såvel generelle som modelspecifikke kriterier for etablering af datagrundlag for de 5 hypoteser. Der er valgt følgende generelle kriterier ved udvælgelsen af handler fra databasen:

Frie handler
100 %'s ejendomsoverdragelse
Handelspris og ejendomsvurdering større end 0
Depotstatus 1-6.

Dertil kommer de anvendte hypotesespecifikke kriterier:

Kode for landsdel
Zonekode
Benyttelseskode
Kode for database/ordning.

Desuden har det været en forudsætning, at der er tale om ikke afvigende observationer. Ved hjælp af SPSS' faciliteter(Stem-Leaf-analyse) er afvigende observationer udvalgt.

I Tabel 3-9 er anvendt datagrundlag efter filtrering vist.

Det ses af tabellen, at datagrundlaget er solidt for så vidt angår hypoteserne 1-4, mens datagrundlaget for hypotese 5 er svagere.

Tabel 3-9 Anvendt datagrundlag for hypoteserne 1-5

Depotstatus	Hypotese 1 Landsdel	Hypotese 2 Zone	Hypotese 3 Benyttelse	Hypotese 4 ordning	Hypotese 5 Gensalg
1. Mistanke	2.367	1.857	2.292	2.367	18-29
2. Forurenet	2.439	1.844	2.411	2.439	22-40
3. Oprenset	643	570	629	643	46-63
4. Restforurening	548	433	538	548	63
5. Undersøgt uden fund	240	203	230	240	29
I alt depotstatus 1-5	6.237	4.907	6.100	6.237	-
6. Ikke forurenet	558.806	503.563	547.870	558.806	-

Det kan endvidere konkluderes, at forudsætningerne for variansanalyserne, dvs.

uafhængige observationer (handler)
normalfordelte residualer (normalitet)
varianshomogenitet

er opfyldte for alle modelhypoteser med tilstrækkelig tilnærmelse til at gennemføre den statistiske analyse.

Ved de gennemførte analyser er det endvidere valgt at benytte 10 %'s niveau for variansanalysemodellen og 90 %-konfidensinterval for middelværdierne.