Ukrudtsstriglingens effekter på dyr, planter og ressourceforbrug

4 Statistiske analyser

4.1 Lærkeundersøgelse

4.1.1 Statistisk metode – kunstige reder

Hver kunstig rede er klassificeret som værende enten ødelagt eller intakt efter hver strigling, og data analyseres derfor vha. logistisk regression. På grund af de små antal er der valgt eksakt logistisk regression (som generaliserer Fishers eksakte test i 2 x 2 tabeller) med de 3 faktorer: mark, behandling og år. Der beregnes derfor kun p-værdier og ingen effekt-størrelser. Data analyseres efter 2. og efter 3. strigling, og efter 3. strigling vurderes endvidere om reder, der har overlevet 2. strigling, har samme chance for at overleve 3. strigling som de øvrige reder; denne faktor kaldes Status (S). Hvis ikke andet er anført, er statistiske analyser udført i SAS (SAS Institute, 2004).

4.1.2 Statistisk metode – naturlige reder

Studiet blev designet som et cross-over forsøg, hvor hver mark blev delt i 2 markhalvdele (plots), og den ene halvdel blev striglet det første år, men ikke det andet år og omvendt for den anden halvdel, jf. Tabel 4.1.

Tabel 4.1. Cross-over design.

    År
Mark Markhalvdel 2004 2005
Keglehøj Plot 1 Ustriglet Striglet
Plot 2 Striglet Ustriglet
Krovang Plot 3 Ustriglet Striglet
Plot 4 Striglet Ustriglet

Grundmodel

I dette design er forsøgsenheden plots. I princippet bør variationen mellem plots betragtes som ”tilfældig”; men der indgår kun 4 plots i alt og den behandles derfor som en systematisk faktor (P: 4 niveauer). Af samme årsag behandles variationen mellem de 2 år som en systematisk faktor (Y: 2 niveauer). Endvidere indgår behandling (striglet/ustriglet) som en systematisk faktor (B: 2 niveauer). Modellen for en vilkårlig responsvariabel (R) kan derfor symbolsk skrives som:

          R = P + Y + B                   (1)

I et cross-over forsøg som dette kan man ikke udelukke en carry-over effekt, i dette tilfælde svarende til om foregående års behandling kan have indflydelse på responsen i år. En carry-over effekt svarer til tilstedeværelsen af en interaktion mellem Y og B, symbolsk skrevet Y*B. I det her valgte design er det dog ikke muligt at tilføje dette led til modeludtrykket (1) ovenfor, fordi effekterne P, Y, B og Y*B ikke længere vil være entydigt bestemt (som 2 ligninger med 3 ubekendte). Hvis man i stedet erstatter faktoren plots med mark (M: 2 niveauer) vil det være muligt at tilføje interaktionsleddet:

          R = M + Y + B + Y*B        (2)

Men i denne model antages implicit, at variationen mellem de 2 plots i samme mark er uden betydning for responsen. Vi har valgt at benytte model (1) fordi den bedst svarer til det valgte design med de etablerede plots, og vi antager derfor at carry-over effekten er forsvindende.

Analyse af ynglesucces

Som responsvariabel er benyttet "mindst 1 flyvefærdig unge pr rede". Det er antaget, at hvert ynglepar for hver af deres reder har samme sandsynlighed for at producere mindst en flyvefærdig unge. Med denne antagelse kan man for hvert ynglepar beskrive antallet af succesfulde yngleforsøg, dvs. forsøg med mindst 1 flyvefærdig unge, med en binomialfordeling med antalsparameter N = antal yngleforsøg og sandsynlighedsparameter = sandsynligheden for et succesfyldt yngleforsøg (for det givne par). Selve den statistiske analyse er gennemført som en standard generaliseret lineær model med binomialfordeling (= logistisk regression på aggregerede data).

Analyse af ungevægte

Ungevægte er analyseret som en ”mixed model”, symbolsk skrevet som:

          W = P + Y + B + A + B*A + [U] + [R] + [R*A] + [E]        (3)

De systematiske faktorer er: P, Y og B defineret som ovenfor (plot, år og behandling). Faktor A betyder alder (5, 7 eller 8 dage) og B*A er interaktion mellem behandling og alder. De tilfældige faktorer er: [U] svarende til gentagne målinger på den enkelte unge, [R] gentagne målinger på unger fra samme rede og [R*A] gentagne målinger på unger fra samme rede og med samme alder. [E] er residual-variation. En varianskomponent svarende til gentagne reder i samme territorium (samme ynglepar) var uden betydning.

Specielle problemer

I mange tilfælde kan yngleparrene nå at lave flere yngleforsøg i deres respektive territorier. Hvis yngleparrene ikke er lige succesrige (enten pga. yngleparrets egne evner eller det valgte territoriums egnethed) vil der kunne opstå en korrelation mellem responsen fra forskellige reder fra samme ynglepar. Dette problem er forsøgt løst via den såkaldte GEE-metode (GEE = Generalized Estimation Equation), som kort fortalt tillader korrelation mellem gentagne målinger på det enkelte territorium. I almindelighed påvirker det ikke estimaterne af de relevante parametre, men derimod øges deres standard errors og dermed vil p-værdierne blive større.

Responsvariablen CLUTCH er defineret som ´det maksimale antal lagte æg’. Pr. definition vil en aktiv rede indeholde mindst 1 æg (CLUTCH>0). Man kan derfor ikke umiddelbart anvende f.eks. en Poisson fordeling eller en negativ binomialfordeling til at beskrive antal æg pr. aktiv rede, fordi disse standardfordelinger vil tildele begivenheden ”0 æg” i en rede en positiv sandsynlighed. I stedet har vi valgt at bruge en såkaldt trunkeret Poisson fordeling (Grogger 1991), hvor der betinges med at CLUTCH skal være positiv. Det samme gælder for antal aktive reder pr. territorium.

Hvis reder med ”BROOD” (= maks. antal redeunger) eller ”FLEDGL” (=  antal ’udfløjne’ unger) præderes, vil det oftest være hele reden der tømmes, dvs. det antal BROOD/FLEDGL, der registreres, vil blive 0. På den måde kan prædation give en overhyppighed af 0’er (og det understøttes faktisk af data), som ikke umiddelbart kan beskrives med f.eks. en Poisson fordeling. Fænomenet kaldes på engelsk ”zero-inflation” (Lambert 1992). For at løse dette problem har vi valgt en model, som kombinerer en Poisson model for BROOD/FLEDGL med en logistisk regressionsmodel for overhyppigheden af 0’er. Den logistiske regressionsmodel kan modelleres efter samme koncept som Poissonmodellen, men de relativt få observationer sætter grænser for hvor mange effekter der kan estimeres. I prioriteret rækkefølge har vi valgt at fokusere på: 1. forskel på de 2 år, 2. forskel på de 2 marker og 3. forskel på ustriglet/striglet. Analyserne med trunkeret og ”zero-inflated” Poisson-model med GEE er lavet ved hjælp af Stata 9 (StataCorp. 2005).

Tolkning af parameterestimater

Poisson-modellerne er såkaldte log-lineære modeller, dvs. den naturlige logaritme til middelværdien er lineær i de forklarende variable, jf. Model (1) ovenfor. Den statistiske analyse giver derfor estimater på den logaritmiske skala. Når estimaterne transformeres tilbage med exponentialfunktion fås estimater for de relative forskelle i middelværdierne. Betragt f.eks.  behandlingen (B) i Model (1). Hvis vi vælger behandlingsniveauet ”Ustriglet” som reference, vil det tilbagetransformerede estimat for ”Striglet” kunne fortolkes som den relative forskel i forventet antal mellem ”Striglet” og ”Ustriglet”. Hvis det tilbagetransformerede estimat er 0.9, vil det forventede antal på den striglede markhalvdel være 90 % af antallet på den ustriglede markhalvdel etc.

Logistisk regression/binomialfordelings-modellerne (mindst 1 flyvefærdig unge pr. rede, zero-inflation) er log-lineære på odds, dvs på den naturlige logaritme til forholdet mellem sandsynlighederne for ”succes” og ”ikke succes”. Når de tilsvarende estimater tilbagetransformeres med exponentialfunktion fås estimater for odds ratio (OR), det vil sige forholdet mellem 2 odds. Som i Poissonmodellen vælges et referenceniveau, f.eks. ”År 2004”. Odds ratio for år 2005 vil da udtrykke forholdet mellem de 2 odds for år 2005 og år 2004. Hvis OR<1 vil odds for 2005 være mindre end odds for 2004, det betyder at sandsynligheden for succes vil være mindre i 2005 end i 2004. Hvis OR=1 er der ikke forskel på de 2 år, og hvis OR>1 vil sandsynligheden for succes være større i 2005 end i 2004. Bemærk, at ”succes” bruges i betydningen ”et redeforsøg med min. en udfløjen unge”.

4.1.3 Statistisk metode – modelleringer på landskabsniveau

Modelsimuleringer bliver udført (10 replikater) for de udvalgte arter for en periode på 50 år. Statistiske analyser af forskelle mellem de enkelte scenarier er meningsløse (Topping & Odderskær, 2004), der kan udføres så mange replikater der kræves for at opnå en given fastsat konfidensgrænse for resultaterne (se endvidere afsnit 5.3).

4.2 Mikroleddyr, regnorme og ukrudt/høstudbytte

Data for antal dyr, antal arter og vådvægt blev analyseret vha. variansanalyse for effekter af behandling (antal striglinger samt striglet/ustriglet), blok og behandling*blok med blok som tilfældig variabel (proc MIXED i SAS; SAS Institute, 1992). Data for springhaler og mider blev kvadratrodstransformeret, idet denne transformation i gennemsnit gav den bedste tilnærmelse til normalfordelingen. Test af utransformerede og logaritmetransformerede data viser imidlertid, at analyserne er temmelig ufølsomme over for valget af transformation. Da der i nogle tilfælde ikke kunne opnås varianshomogeneitet, blev der taget hensyn til dette ved at indføre et ”repeated”- statement i proc mixed.

Der blev anvendt variansanalyser til at undersøge om strigling påvirker ukrudtet og afgrøden. Sammenhængen mellem ukrudtsbiomasse og jordfaunadata blev undersøgt ved at teste Spearman korrelationskoefficient, som er ret ufølsom over manglende normalfordeling og ikke forudsætter lineær sammenhæng, i proc CORR i SAS.

4.3 Ukrudt og høstudbytte

Ukrudtsbiomasse og høstudbytte (kerne og halm) blev analyseret statistisk med en variansanalysemodel med behandling, mark og år som systematiske klassevariabler og blok var nestet inden for år og mark. Alle vekselvirkninger mellem behandling, mark og år ved inkluderet i modellen. Efter inspektion af residualerne blev det besluttet at log-transformere alle data for at skabe varianshomogenitet. Ved opsplitning af kvadratafvigelsessummen (SAK) blev det testet om der var forskelle mellem de behandlede parceller (1, 2 og 3 harvninger) eller forskelle mellem de behandlede i én gruppe (1, 2 og 3 harvninger) og de ubehandlede (0 harvninger) jævnfør Little (1991). Data blev analyseret med proceduren GLM i SAS.

 



Version 1.0 Januar 2007, © Miljøstyrelsen.