Impulsstøj 5. Lyttetest5.1 Generelt om lyttetestOfte kaldes lyttetest for subjektive målinger, fordi resultaterne opnås på baggrund af menneskers vurderinger i modsætning til fysiske målinger, der normalt opfattes som objektive. Ved veltilrettelagte lyttetest, hvor entydigt definerede egenskaber ved lyden skal vurderes, kan menneskers sanser dog bruges som "måleinstrumenter" på linie med teknisk måleudstyr. Idet lyttetest alt efter formål og udførelse kan være subjektive eller objektive, er det nødvendigt med en nuancering af disse begreber. 5.1.1 Affektive testDer er tale om subjektive lyttetest, hvis lytternes præferencer efterspørges. Resultaterne vil i almindelighed afhænge af, hvilken gruppe mennesker og under hvilke omstændigheder man spørger. For at undgå begrebsforvirring kaldes sådanne lyttetest i det følgende ikke subjektive, men affektive test. Undergrupper af disse kan være markedsanalyser og præferencetest. Som specielle præferencetest figurerer test, hvori genebegrebet indgår. Sædvanligvis bruges udvalgte persongrupper, som er repræsentative i forhold til den problemstilling, man ønsker belyst. Eksperter eller trænede lyttere kan normalt ikke anses for repræsentative og bruges normalt ikke i denne sammenhæng. Man kan sige, at hovedformålet med denne slags test er at give information om mennesker i en given kontekst. 5.1.2 Auditive målingerHvis lyttetestens formål er at belyse, hvordan en bestemt egenskab ved lyden opfattes af hørelsen, kaldes testen objektiv eller analytisk. Det kræves, at den egenskab, der skal vurderes, kan beskrives eller eksemplificeres objektivt og på en sådan måde, at alle lyttepersonerne har en klar og entydig opfattelse af, hvilken egenskab ved lyden de skal lytte efter og vurdere. Man benytter sædvanligvis eksperter eller trænede lyttere til sådanne test. Objektive målinger, hvor mennesker bruges som måleinstrumenter, kaldes også perceptive målinger. Inden for levnedsmiddelforskningen bruges begrebet sensoriske analyser, og i forbindelse med lyttetest bruges udtrykket auditive målinger eller analyser. For de auditive målinger kan man hævde, at hovedformålet er at give information om lyden eller en bestemt egenskab ved den, som den opfattes af hørelsen. 5.1.3 SammenfatningOvenstående kan sammenfattes i Figur 5.1. Figur 5.1 Se
her! I Målepunkt 1 kan vi udføre fysiske målinger ved hjælp af teknisk måleudstyr (mikrofoner, lydtrykmålere, analysatorer m.m.). Disse målinger er objektive. Filter 1 illustrerer vores sanser. Bag ved dette kan vi i Målepunkt 2 udføre objektive målinger med mennesker som måleinstrumenter (perceptiv måling). Præferencer efterspørges ikke, der spørges kun til intensiteten/styrken og karakteren af sanseindtrykket i objektive termer. Når sanseindtrykket er lyd, taler vi om en auditiv måling. Psykoakustikken har sit grundlag i Målepunkt 2. Filter 2 illustrerer den subjektive indflydelse på menneskers opfattelse af omverdenen. Bag dette kan vi i Målepunkt 3 udføre de affektive test, herunder præferencemålinger og undersøgelser af støjgener. Resultatet afhænger i almindelighed af konteksten (den sammenhæng, i hvilken undersøgelsen foregår) og vil typisk være påvirket af en lang række faktorer herunder stimuli fra andre sanser samt holdningsmæssige og sociale faktorer. Ideelt set er der en klar opdeling mellem auditive målinger og præferencemålinger, og det er vigtigt at skelne mellem dem, når lyttetest planlægges, udføres og fortolkes. I praksis forekommer der et vist overlap, og der er ikke altid en klar skillelinie mellem de to slags test. Dette kan føre til usikre og usammenlignelige resultater. Holdbare generaliseringer ud fra lyttetest kræver, at man har styr på disse problemstillinger. 5.2 Lyttetest af impulslydSom det fremgår af Afsnit 5.1, skal der dels skelnes mellem auditive målinger (impulsernes tydelighed) og affektive test (dvs. målinger af gene i nærværende sammenhæng). I det følgende beskrives, hvorledes dette er håndteret i nærværende projekt. 5.2.1 Impulsers tydelighed/påtrængenhedDer arbejdes ud fra en hypotese om, at impulsernes tydelighed indgår som et væsentligt element i den gene, impulserne giver anledning til. En evt. måle- eller vurderingsmetode for impulsernes tydelighed skal udløse et tillæg til LAeq, som "kompenserer" for den ekstra gene, som impulserne giver anledning til. En måling/vurdering af tydeligheden anses derfor som et vigtigt led i administration af et tillæg for impulser. Målingen af, hvor tydelig impulser i støjen opfattes, er en objektiv måling, hvor svaret opnås ved en auditiv analyse. Dette forudsætter, at impulsbegrebet er defineret eller eksemplificeret på en måde, så alle lytterne har en klar og entydig opfattelse af, hvilken egenskab ved lyden, de skal vurdere. I relation til dette projekt er der et paradoks: På den ene side skal begrebet impuls og impulsens tydelighed beskrives eller eksemplificeres objektivt for lytterne til brug for den auditive måling; på den anden side ønsker vi en bedømmelse, som gør det muligt dels at fastlægge begrebet og dels at definere en målemetode, der kan bruges til at karakterisere det. For at omgå dette paradoks er der gjort følgende:
Som supplement til begrebet "tydelig" er der søgt efter et sammenfattende begreb for pludselighed, relativt højt niveau og hørbarhed; et begreb, som relaterer sig til lydens karakter, og som - uden at det nævnes direkte - måske også inkluderer noget om antallet af impulser. Efter overvejelse af forskellige alternativer er det besluttet at bruge ordet "påtrængende". Ordet er måske lidt mere subjektivt præget og knapt så beskrivende i forhold til lydens karakter som "tydelig". Det er forsøgt at finde et ord, som ikke er værdiladet. Nogle finder lyden af knaldfyrværkeri plagsom og generende, mens andre synes, den er spændende og interessant, men begge kan vel være enige om, at den er påtrængende. Til vurderingen af impulsernes tydelighed (og påtrængenhed) skal ideelt set benyttes trænede lyttere eller eksperter. DELTAs ekspertlyttere indgik som én gruppe, men vurderingerne blev også foretaget af testpanelet efter en kort introduktion som nævnt ovenfor. Derudover blev hele første lytterunde betragtet som en træningssession, idet resultaterne herfra kun blev brugt til at vurdere lytternes konsistens i vurderingen af de forskellige lydeksempler, se Afsnit 5.4.2.2. 5.2.2 GeneHvor generende man opfatter en lyd, afhænger som tidligere nævnt af lydkilden, personens holdninger til den, sociale faktorer, tidspunkt på døgnet, personens beskæftigelse (fritid, læsning, arbejde, søvn ), lydens styrke og karakter m.m. Måling af støjgene er således en affektiv måling, og mange internationale eksperter er af den opfattelse, at gene ikke kan måles i et laboratorium, men kun kan findes ved interviewundersøgelser de steder, hvor folk i praksis er udsat for støjen. I nærværende undersøgelse er det alligevel valgt at spørge lytterne, hvor generende de opfatter de forskellige støjeksempler. Denne laboratoriemålte støjgene kaldes af og til for den psykoakustiske gene eller støjens genepotentiale. Formålet var i nærværende sammenhæng at få en relativ vurdering af, hvor ubehageligt eller generende forskellige lydeksempler opfattes i forhold til hinanden. Genebegrebet er ikke i forbindelse med lyttetesten blevet defineret over for forsøgspersonerne, idet det forudsættes, at der i almindelighed er en generel opfattelse af, hvad gene er. Det antages derfor, at det er muligt at spørge til "gene" uden nogen nærmere definition af begrebet. De lyttere, der deltager i lyttetesten, gør det, fordi de på en eller anden måde finder det interessant at være med. Det må derfor antages, at der først er tale om en egentlig gene i forbindelse med lyttetesten, når lyden bliver direkte ubehagelig at høre på. Med maksimalniveauer, LAmaxF, på højst 80 dB vil dette ikke være udpræget. Derfor er det valgt at stille et hypotetisk spørgsmål, der vedrører lytterens hjemmesituation. Som det fremgår af instruktionen til lytterne i Bilag 18, skal lytterne vurdere, hvor generende den støj, de præsenteres for i laboratoriet ville være, hvis støjen var karakteristisk for forholdene uden for lytterens egen bolig. Denne hjemmeprojektion er er ofte benyttet i tilsvarende undersøgelser. Det vides ikke, i hvilken grad det genepotentiale, der på denne måde er målt i laboratoriet, indgår i den gene, der konstateres ved interviewundersøgelser af gene i det virkelige liv. For at gøre det lettere for forsøgspersonerne at forestille sig hjemmesituationen var der ophængt 12 farvefotografier (42 ´ 60 cm), hvor motivet var opholdsarealer uden for boliger (etageboliger, rækkehuse og parcelhuse), se Bilag 16. Baggrunden for dette var et udsagn fra lytterne i første lytteforsøg (eksemplerne i P-gruppen: 7. sammenlignende støjmåling) om, at det var svært at forestille sig genen hjemme, når man sad i laboratoriet. Et par af lytterne i de senere runder gav uopfordret udtryk for, at billederne gjorde det lettere at forestille sig hjemmesituationen. Da der er tale om en affektiv test, bør der ideelt set ikke bruges eksperter. Det er dog valgt at bruge både eksperter og "almindelige mennesker", som er rekrutteret fra DELTAs testpanel. Dette er nærmere omtalt i Afsnit 5.3.2. Grunden til dette har bl.a. været et ønske om at skabe sammenhæng mellem de vurderinger, der blev foretaget af de godkendte laboratorier (dvs. ekspertvurderinger) ved 7. sammenlignende støjmåling og DELTAs ekspertlyttere, og dels et ønske om at forsøge at skabe sammenhæng mellem ekspertvurderinger og almindelige menneskers vurderinger. 5.3 Overvejelser vedrørende lytteforsøg5.3.1 Overordnet strategiLyttetesten gennemføres efter følgende plan:
Begrundelsen for dette forløb er følgende: De vurderinger af lydeksemplerne, der blev foretaget i forbindelse med 7.sammenlignende støjmåling, se Afsnit 4, var ikke udført under kontrollerede forhold. Opgaven ved 7. sammenlignende støjmåling var at tage stilling til tildeling af impulstillæg og ikke direkte at vurdere støjens karakter. For at få foretaget en vurdering under mere kontrollerede forhold af både impulstillæg og støjens karakter og for at få muligheden for at skabe forbindelse mellem eksemplerne i 7. sammenlignende måling og de eksempler, der i øvrigt indgår i nærværende undersøgelse, foretages i første lyttesession fornyede vurderinger af eksemplerne fra 7. sammenlignende støjmåling af en "ekspertgruppe". Da ekspertgruppen er bekendt med problematikken omkring tildeling af impulstillæg, er det muligt både at få en vurdering af lydens karakter og af rimeligheden i at tildele et 5 dB-impulstillæg. Ved vurderingen af lydens karakter er det alene tydeligheden og "genen" af impulserne, der skal vurderes. Der er ikke spurgt, om man mener, at kilden skal karakteriseres som en impulsstøjkilde. Eksperternes praktiske erfaring og arbejde med de nugældende støjvejledninger kan betyde, at deres vurderinger af lydens karakter er påvirket af kildens art i større grad, end tilfældet er for "ikke-eksperterne". Dette undersøges ved at sammenligne resultaterne af tredje lyttesession med resultaterne af anden lyttesession, som jo er vurderinger fra 12 "ikke-ekspertlyttere". Blandt de 8 personer, der deltog i første lyttesession, skulle udvælges 5 ekspertlyttere til tredje lyttesession. Kriterierne for udvælgelse er: god overensstemmelse med de øvrige ekspertlyttere og rimelig overensstemmelse med resultatet af 7. sammenlignende støjmåling. 5.3.2 Valg af forsøgspersonerDe 8 lyttere til første lytteforsøg (lydeksemplerne fra 7. sammenlignende støjmåling) blev udvalgt blandt ingeniører, som arbejder med støjmålinger, og som er ansat på DELTA Akustik & Vibration. De 12 "ikke"-eksperter blev valgt blandt DELTAs testpanel på i alt 60 personer. Disse personer har ingen specielle forudsætninger for at deltage, ud over at de har reflekteret på en annonce om at være med til lytte- og kiggeforsøg og forskellige andre målinger, der kræver medvirken af mennesker. Ud over at være medlem af testpanelet havde lytterne ingen direkte tilknytning til DELTA Akustik & Vibration, og de havde ingen interesser i problemstillingen eller forudgående erfaring i emnet. De 12 personer blev udvalgt blandt personer, der angav at have normal hørelse, og ud fra kriterier om en ligelig fordeling mellem kvinder og mænd samt en passende aldersspredning. 5.3.3 Overvejelser og begrundelser for udformning af spørgeskemaerDet er grundlæggende valgt at gennemføre lyttetesten som en semantisk differentieret test uden tilstræbt sammenligning af lydeksempler. Lytterne markerer deres vurderinger på svarakser, som er trykt på papir. For at undgå direkte sammenligninger mellem vurderingerne af lydeksemplerne er spørgsmålene til hvert lydeksempel anført på en side for sig, så der skal blades om til næste side for hvert eksempel. Akserne er principielt lukket i begge ender, men der er tilføjet en vis "reserve" i den høje ende af aksen til svar, der kunne vise sig at skulle have en endnu højere vurdering end det, forsøgspersonen først troede var det højeste. Formålet med dette er at give forsøgspersonerne større mod på at udnytte hele intervallet mellem de to markeringer. Svarakserne har en længde på 15 cm. Det har i andre sammenhænge [26] vist sig at være en hensigtsmæssig længde. Det er valgt først at spørge efter en vurdering af "genen" og dernæst at spørge efter impulsernes tydelighed og påtrængenhed. Formålet med denne rækkefølge er at undgå en for snæver sammenhæng mellem vurderingen af lydens gene og tydeligheden/påtrængenheden af impulserne. For eksperternes vedkommende er spørgsmålet om tildeling af impulstillæg anbragt til sidst som en slags konklusion af de gennemførte vurderinger. Eksperterne er bedt om at tage stilling til det 5 dB-tillæg, som de har erfaring med. (Der ligger ikke i dette, at et fremtidigt tillæg nødvendigvis skal være 5 dB). For alligevel at få en vis graduering i besvarelserne kan eksperterne i fem afkrydsningsbokse angive, hvor overbeviste de er om tildelingen af impulstillægget. Spørgeskemaerne med den tilhørende instruktion er vist i Bilag 17 og 18. 5.4 Afvikling af lyttetest5.4.1 Udstyr til præsentation af lydeksemplerneDe producerede DAT-bånd, se Afsnit 4.4, blev afspillet på en DAT-båndoptager HHB Portadat type PDR 1000. Fra båndoptageren blev signalet fra de to kanaler (venstre og højre) ført til hver sin passive attenuator (Danbridge og GR), så niveauet kunne reguleres i kalibrerede trin af hhv. 1 og 0,1 dB. Fra attenuatorerne blev signalerne ført til en hovedtelefonforstærker Brüel & Kjær type ZE 0769 og derfra fordelt til 8 sæt kalibrerede hovedtelefoner Sennheiser HD 580 (åben type). Hovedtelefonerne er udvalgt, så forskellene i lydtrykniveauet i området 50-5000 Hz typisk er mindre end ca. 1 dB. Inden lytteforsøget blev lytteniveauet indstillet ved at anbringe et sæt hovedtelefoner på et kunsthoved Brüel & Kjær type 4100, som via en forforstærker Brüel & Kjær type 2672 var forbundet til to Brüel & Kjær måleforstærkere type 2610, hvorpå lydtrykniveauerne kunne aflæses. Kunsthoved og måleforstærkere blev kalibreret med en akustisk kalibrator Brüel & Kjær type 4130. Afspilleudstyret var anbragt i samme lokale som lytterne. Lytterne kunne hverken se eller høre udstyret (bortset fra hovedtelefonerne) ved lyttetesten. 5.4.2 Lokale og forløbLytteforsøgene blev som planlagt, se Afsnit 5.3.1, udført ad 3 omgange. Alle tre sessioner blev afholdt i lytterummet hos Instituttet for Akustisk teknologi på DTU. Efterklangstiden i rummet er indreguleret i henhold til IEC 268-13 [13] og svarer til efterklangstiden i en gennemsnitsdagligstue. Dette har ikke direkte betydning for aflytningen af lydeksemplerne, som skete via hovedtelefoner, men nok indirekte gennem oplevelsen af det akustiske miljø før og efter selve lyttetesten. Baggrundsstøjen var lav for det meste LAF = under 25 dB uden lyttere. Rummets dimensioner er L ´ B ´ H = 7,5 m ´ 4,7 m ´ 2,8 m, og der er således god plads til 8 lyttere. Under forsøgene var lytterne, højst 7 ad gangen, placeret på stole, som var opstillet i en rundkreds med ryggen ind mod rummets midte. Lytterne kunne kun med besvær se hinandens svarskemaer, og hver lytter havde i anden og tredje lyttesession "udsigt til" 3-4 af de 12 ophængte farvefotos. Den ene tredjedel (ca.) af rummet var delt fra af et tyndt gardin. Bag dette var forsøgslederen og det tekniske udstyr placeret. 5.4.2.1 Første lyttesession Instruktionen for lyttesessionen blev udleveret og gennemgået. Lyttesessionen startede direkte, dvs. uden træningsrunde før selve lyttesessionen, som varede ca. 10 minutter. De 13 eksempler fra 7. sammenlignende støjmåling havde i deres oprindelige form forskellige LAeq-værdier, men blev i dette lytteforsøg alle præsenteret med et LAeq-niveau på 60 dB, hvilket lytterne blev gjort bekendt med. Det formodes at være lettere at tage stilling til impulstillægget, når det på forhånd vides, at lydene har samme LAeqværdi. Lydene blev præsenteret i samme rækkefølge som ved den 7. sammenlignende støjmåling. Lydene blev præsenteret uden anden baggrundsstøj end den ubetydelige støj, der var i lokalet fra de stillesiddende forsøgspersoner. Der deltog 8 mandlige lyttere udvalgt blandt ingeniører, som arbejder med støjmålinger, og som er ansat på DELTA Akustik & Vibration. Kun resultaterne fra de 5 udvalgte ekspertlyttere går videre i databehandlingen. En enkelt lytter bemærkede efter sessionen, at det var svært at finde et relevant svarniveau i starten, og at vurderingen af de første eksempler måske ville have været anderledes, hvis han havde kendt nogle af de øvrige på forhånd. 5.4.2.2 Anden lyttesession Efter en kort velkomst blev lytterne placeret i lytterummet, hvor instruktionen blev gennemgået, herunder også instruktion i at placere hovedtelefonerne korrekt - bl.a. med hensyn til placering af højre og venstre telefon (dette blev kontrolleret af forsøgslederen). Herefter blev demonstrationseksemplerne afspillet og proceduren med afkrydsning på akser mv. gennemprøvet. Der blev så holdt en kort (5-7 minutter) pause uden for lytterummet, hvorefter lyttesessionen blev afviklet som følger:
Lytterne fik systematisk nye pladser i hver lytterunde, så de ikke sad ud for de samme billeder i hver runde. Anden lyttesession blev afviklet ad to omgange med 6 lyttere i hver omgang. Der blev benyttet forskellige randomiseringer af signalerne i de to omgange. De første 7 eksempler i første runde betragtes som træningseksempler. Ud fra resultaterne af de sidste 10 eksempler i første og tredje runde vurderes konsistensen af lytternes svarafgivelse. Kun resultaterne fra anden og tredje runde udnyttes i den videre databehandling. I denne session deltog i alt 12 personer - 5 mænd og 7 kvinder - fra DELTAs testpanel. Disse betragtes i denne sammenhæng som naive lyttere. Personerne var mellem 18 og 62 år, gennemsnitsalderen var 37,6 år. 5.4.2.3 Tredje lyttesession På baggrund af resultaterne fra første lyttesession se Afsnit 5.5.1 - blev 3 lyttere fravalgt. De 5 resterende "ekspertlyttere" vurderer de samme lydeksempler som lyttepanelet og under samme omstændigheder. Alderen på de 5 udvalgte mandlige ekspertlytterne var mellem 30 og 55 år, gennemsnitsalderen var 45,6 år. 5.5 Resultater af lyttetest5.5.1 Vurdering af testpersonernes kvalifikationerDet var på forhånd besluttet, at kun et mindre antal af ekspertlytterne skulle være gennemgående i første og tredje lyttesession. Kriteriet for udvælgelse var god overensstemmelse med de øvrige ekspertlyttere og resultatet af 7. sammenlignende støjmåling. Udvælgelsen af de 5 gennemgående ekspertlyttere skete ud fra resultaterne af første lyttesession som beskrevet i det følgende. Der blev for hver person og hvert lydeksempel dannet en middelværdi af alle svarene undtagen af svarene på genespørgsmålet, som generelt afveg fra de øvrige svar. Disse middelværdier blev korreleret med en tilsvarende middelværdi for alle forsøgspersoner kombineret med svarene fra de laboratorier, der deltog i 7. sammenlignende støjmåling. De tre personer, der havde den laveste korrelation med denne kombinerede værdi, blev udelukket i den videre databehandling. De resterende 5 personer havde alle en korrelationskoefficient, som var større end 0,70 med den kombinerede middelværdi. Disse personer kan således i denne sammenhæng i rimeligt omfang anses for repræsentative for personer, der udfører støjmålinger og herunder vurderer støjens karakter. Testpanelets kvalifikationer som lyttere ved vurdering af impulser var ukendte, og der blev derfor foretaget vurderinger af svarenes konsistens mellem første og anden runde. For ikke at træningseffekter skulle have for stor indflydelse, blev de 7 første svar i hver runde udeladt. Konsistensen blev udtrykt som standardafvigelsen af forskellene mellem første og anden runde midlet over de tre parametre "gene", "tydelig" og "påtrængende". Denne standardafvigelse lå for de fleste personer mellem 1 og 3 cm og lavest for ekspertlytterne. Figur 5.2 Det ses, at person nr. 5 ligger markant højere end alle andre i denne test, og at person nr. 15 ligger højere end de øvrige ekspertlyttere. Person 15s resultat i denne test skyldtes en enkelt outlier (som udelades i den videre databehandling) i første runde. Supplerende blev der foretaget vurdering af, om personernes svar lå langt fra middelværdierne. Svar, der afviger mere end 1,5 gange standardafvigelsen, bliver i det følgende kaldt "afvigende svar", mens svar, der afviger mere end 3 gange standardafvigelsen, benævnes som "outliers". Figur 5.3 Det ses, at person nr. 5 har mange afvigere. Det er der i sig selv ikke noget mærkeligt i, idet det kunne skyldes en anden brug af svarskalaerne end flertallet af lyttere, men set i sammenhæng med de inkonsistente svar, se Figur 5.2, synes det relevant at udelade denne persons svar i den videre databehandling. Imidlertid ændrer forholdene sig med hensyn til afvigende resultater, når man kun betragter anden runde med LAeq = 60 dB, idet andre personer så har et større antal afvigende resultater. I stedet for at udelukke personer som helhed blev datamaterialet gennemset for outliers, dvs. for resultater, der afveg mere end 3 gange standardafvigelsen fra middelværdierne. Der var for eksemplerne med LAeq = 60 dB i alt 10 enkeltresultater i anden runde, som kunne betegnes som outliers. Disse blev udelukket af materialet. 5.5.2 Ekspertlyttere kontra lyttepanelI dette afsnit sammenlignes svarene fra ekspertlytterne med responsen fra lyttepanelet. Figur 5.4 Tabel 5.1 Se
her! Af Figur 5.4 ses, at for alle tre parametre "gene", "tydelig" og "påtrængende" gælder det, at lydeksemplerne ved LAeq = 60 dB vurderes højere end lydeksemplerne ved LAeq = 40 dB. For "gene" er det helt entydigt, idet alle lydeksemplerne LAeq = 60 dB (middelværdi 10,8 cm) vurderes højere end lydeksemplerne ved LAeq = 40 dB (middelværdi 6,2 cm). Med de valgte lydeksempler svarer en forskel i LAeq på 20 dB i gennemsnit til 4,6 cm på geneaksen. Der er en tendens, til at eksperterne vurderer 60 dB-eksemplerne som mere generende end panelet, mens det er omvendt ved 40 dB-eksemplerne, men i det store og hele er der ikke væsentlig forskel på eksperternes og panelets vurderinger af "genens" størrelse. Generelt ses af Figur 5.4, at spredningen for "gene" er lidt større for panelet end for eksperterne. Det bemærkes, at spredningen er mindre ved 60 dB (standardafvigelse 1,7 cm) end ved 40 dB (standardafvigelse 3,1 cm). Det kan skyldes mætningsfænomener i den høje del af skalaen. Der er kun meget få vurderinger over 13 cm, der er afmærket med en streg betegnet "Stærkt generende" (skalaen går til 15 cm). Eksempel 13L Trykbor ved 40 dB har størst afvigelse mellem panel og eksperter med hensyn til "gene". Der er god overensstemmelse mellem eksperter og panel med hensyn til "tydelig" og "påtrængende". For "tydelig" og "påtrængende" ved 40 dB var standardafvigelserne stort set ens for eksperter og panel (se Tabel 5.1), mens den var væsentligt mindre for eksperterne ved 60 dB. Når standardafvigelserne tages i betragtning, er der generelt ikke væsentlig forskel på middelværdierne af panelets og eksperternes vurderinger. Den største forskel forekommer ved 40 dB for "påtrængende", hvor eksperterne giver den laveste vurdering. Ud fra det foregående konkluderes det, at der overordnet ikke er grund til at skelne mellem eksperternes og panelets vurderinger. Generelt er spredningen mindre for eksperterne, men middelværdierne af eksperternes vurderinger og af panelets vurderinger ligger nær hinanden set i lyset af standardafvigelsernes størrelse. I det følgende benyttes derfor middelværdierne af både panelets og eksperternes vurderinger. I et enkelt tilfælde synes det klart, at eksperterne bedre har skelnet mellem det generelle lydbillede og den efterspurgte egenskab. Det vil derfor være relevant i enkelte tilfælde at se på eksperternes vurderinger separat. 5.5.3 Sammenhæng mellem "gene", "tydelig" og "påtrængende"Figur 5.5 Af Figur 5.5 ses, at der tilsyneladende er en generel, men ikke specielt udpræget sammenhæng mellem "gene" og henholdsvis "tydelig" og "påtrængende". Hvis man betragter sammenhængen mellem "gene" og tydelig (den øverste figur) og "gene" og påtrængende (den midterste figur), ses det, at de tre grupper af lydeksempler (L: LAeq = 40 dB, P: 7. sammenlignende støjmåling (LAeq = 60 dB) og H: LAeq = 60 dB) udgør næsten lodrette grupper med "gene"-værdier på omkring 4-6 cm, 7-10 cm og 9-12 cm. Andelen af forklaret varians inden for de tre grupper i øverste figur er hhv. L: 0,57, P: 0,51 og H: 0,05. I de to første grupper forklarer tydeligheden ca. halvdelen af variansen på geneaksen, mens der for den sidste gruppe ikke kan siges at være nogen reel sammenhæng. Både lydeksemplerne fra 7. sammenlignende støjmåling og H-gruppen af lydeksempler blev præsenteret ved LAeq = 60 dB. Alligevel falder de to sæt resultater i to grupper. Det er undersøgt, om grunden til dette er, at 7. sammenlignende støjmåling alene er vurderet af eksperterne, mens de to andre grupper repræsenterer gennemsnittet af både eksperternes og panelets vurderinger. En graf som den øverste graf på Figur 5.5, men kun med eksperternes vurderinger, viste dog samme opdeling af punktgrupperne. Det må derfor konkluderes, at omstændighederne ved aflytningen af P-gruppens lydeksempler har haft væsentlig indflydelse på resultaterne. P-gruppen adskiller sig fra L- og H-grupperne bl.a., ved at lydene blev præsenteret i mono og uden baggrundsstøj samt ved en anden rækkefølge af spørgsmålene, jf. evt. Afsnit 7.1. Lytterne blev bedt om at vurdere, hvor generende de ville opfatte støjen, hvis den var karakteristisk for støjen uden for deres bolig. Med et LAeq-niveau på 60 dB giver dette anledning til vurderinger af genen (middelværdien er 10,5 cm for panelet og 11,5 cm for eksperterne, jf. Tabel 5.1), som ligger nær skalaens øvre markering (13 cm) med betegnelsen "Stærkt generende". Mætningsfænomener ved brug af svarskalaen kan således være en mulig forklaring på den manglende sammenhæng for H-gruppen. Denne hypotese underbygges af, at spredningen på "gene" kun er halvt så stor for H-gruppen som for L-gruppen. (Spredningen på "tydelig" er den samme for L- og P-gruppen). I hvert fald kan det undre, at impulserne ikke angives som mere generende, jo tydeligere de vurderes. En anden mulig forklaring kan være, at nogle undersøgelser (jf. Afsnit 2.4) viser et mindre behov for impulstillæg ved højere niveauer (L?? = 80 dB(A)) end ved lave niveauer (L?? = 50 dB(A)). Af den nederste del af Figur 5.5 ses det, at der er en meget tydelig og lineær sammenhæng mellem "tydelig" og "påtrængende". Med en korrelationskoefficient på 0,97 er der ikke grund til generelt at skelne mellem de to begreber. Det skal dog bemærkes, at et par lyde fra den 7. sammenlignende støjmåling skiller sig ud fra det generelle billede, nemlig 3P Vindmølle og 6P Aflæsning af sten. Disse har ikke så udpræget impulskarakter (starter "blødt"), men hændelsen er forholdsvis påtrængende. Disse signaler er også "lange", hvilket kan stride mod en evt. opfattelse hos lytterne af, at impulser skal være "korte" lyde. Selv om det er fristende at opnå større statistisk sikkerhed ved at slå parametrene "tydelig" og "påtrængende" sammen (f.eks. ved at danne middelværdien), er det valgt hovedsagelig at gå videre med "tydelig", da den høje korrelation gør det overflødigt at medtage begge. 5.5.4 Sammenhæng mellem testen ved LAeq = 40 dB og LAeq = 60 dBFigur 5.6 Ud over forskellen i niveau på eksemplerne med LAeq = 40 dB og 60 dB skal det erindres, at eksemplerne blev præsenteret med en baggrundsstøj på LAeq = 40 dB, og at der var foretaget en frekvensvægtning, der skulle simulere større afstand for eksemplerne ved 40 dB. Hvis der var en helt entydig sammenhæng mellem eksemplerne ved 40 og 60 dB, ville punkterne ligge på en linie med hældningen 1. For "gene" er der en tendens, men den er ikke særligt entydig. Som det tidligere er bemærket, er spredningen på vurderingerne større for 40 dB-eksemplerne end for 60 dB-eksemplerne. For parameteren "tydelig" er der en tydelig sammenhæng mellem eksemplerne ved de to niveauer. Dvs. tydeligheden af impulserne rangordnes stort set ens uanset niveauet. Den gennemsnitlige vurdering af impulsernes tydelighed ligger dog ca. 3,4 cm højere for 60 dB-eksemplerne. Dette resultat er forventeligt, da baggrundsstøjen i begge tilfælde var LAeq = 40 dB. Sammenhængen af impulsernes "påtrængenhed" var ikke helt så entydig som for "tydelighed". 5.5.5 Sammenligning med resultaterne fra 7. sammenlignende støjmålingSom nævnt i Afsnit 3 foretog laboratorierne ved den 7 sammenlignende støjmåling bl.a. vurderinger af, hvorvidt der skulle gives impulstillæg ud fra en antagelse om, at de udvalgte 30-60 sekunders optagelser er repræsentative for hele driftstidsrummet. I den sammenlignende måling kunne man svare enten ja eller nej til tillæg. Dette blev rapporteret som den procentdel af laboratorierne, der havde sagt ja. Ved lytteforsøget havde de fem ekspertlyttere 5 svarmuligheder: "Nej!", "Måske nej", "I tvivl", "Måske ja" og "Ja!". Ved databehandlingen blev disse svarkategorier tildelt værdierne fra 1-5, således at 1 svarer til "Nej" osv. For at kunne sammenligne blev procentdelen af ja-svar divideret med 20. Ja-%/20 giver da værdien 0, når alle svarer nej (svarende til 1 ovenfor), og 5, når alle svarer ja (svarende til 5 ovenfor). Figur 5.7 Af Figur 5.7 ses, at der er en pæn sammenhæng mellem laboratoriernes og gennemsnittet af ekspertlytternes vurderinger, når de sikkert meget forskellige lyttebetingelser tages i betragtning.
Tabel 5.2 Et meget konkret forhold er, at ved lyttesessionen blev alle eksemplerne præsenteret ved LAeq = 60 dB, mens de relative værdier af LAeq ved 7. sammenlignende støjmåling fremgår af Tabel 5.2. Det ses af Figur 5.7, at der er overvægt af de høje niveauer i den laveste del af punktgruppen, mens der er overvægt af lave niveauer i den øvre del af punktgruppen. Det svarer til, at laboratorierne har vurderet tydeligheden af impulserne i de eksempler med de højeste LAeq-værdier højere, hvilket er i overensstemmelse med iagttagelserne i Afsnit 5.5.4. I øvrigt ses det, at de største afvigelser mellem eksperternes og laboratoriernes vurderinger fås for:
5.5.6 Sammenhæng mellem "tydelig" og impulstillægSammenhængen mellem ekspertlytternes vurderinger af tydelighed og tildeling af et 5 dB-impulstillæg fremgår af Figur 5.8 Figur 5.8 Det ses, at der er en pæn sammenhæng, og at vurderingen af, om der skal gives et 5 dB impulstillæg er overvejende, når impulsernes tydelighed overstiger 5-6 cm på svarskalaen for tydelighed. Med til vurderingen af den pæne sammenhæng hører, at vurderingen af "tillæg" blev fortaget umiddelbart efter vurderingen af de andre parametre og på samme ark papir. Det bemærkes, at punkterne fra 7. sammenlignende måling ligger højt i punktskaren. Det kan måske skyldes, at disse lydeksempler blev præsenteret uden baggrundsstøj. Ud over den spredning, som altid forekommer ved lytteforsøg, må det antages, at svarene på, om der skal gives et 5 dB-impulstillæg, også indeholder vurderinger af impulsernes hyppighed. Det blev betonet over for lytterne, at det var selve lyden og ikke lydkilden, de skulle vurdere, men det kan ikke udelukkes, at vurderinger af lydkilden også kan have påvirket vurderingen. 5.6 Konklusioner af lyttetesten5.6.1 PræmisserLyttetestens resultater afhænger dels af lydeksemplerne og dels af lytterne, lyttebetingelser, omgivelser, instruktion m.m.. Der er redegjort nærmere for dette i Afsnit 5.3 og 5.4. Paradokset med på den ene side at beskrive begrebet impuls og impulsens tydelighed objektivt på en måde, så alle lyttepersonerne har en klar og entydig opfattelse af, hvilken egenskab ved lyden de skal bedømme, og på den anden side at få en bedømmelse, som gør det muligt at fastlægge begrebet og en målemetode, blev løst ved at give en bred definition af impulsbegrebet ved instruktionen og på svarskemaerne. Dette er nærmere beskrevet i Afsnit 5.2.1. 5.6.2 Kvalifikation af lyttere og resultaterLydeksemplerne fra 7. sammenlignende støjmåling blev vurderet af otte ekspertlyttere, som arbejder med støjmålinger. Ud fra et kriterium om, at svarene skulle være ensartede inden for gruppen og nogenlunde i overensstemmelse med resultaterne af vurderingerne fra de 29 laboratorier, der deltog i 7. sammenlignende støjmåling, blev fem lyttere udvalgt. Tolv utrænede personer fra DELTAs testpanel deltog i vurderingerne af 2 ´ 34 lydeksempler sammen med de fem udvalgte ekspertlyttere. Vurderingerne af lydeksemplerne blev foretaget i tre runder efter en grundig instruktion og aflytning af fire illustrative lydeksempler. Første runde (som blev gentaget som sidste runde) tjente som træningsrunde og blev desuden brugt til at vurdere konsistensen af lytternes svar. Dette gav ikke grundlag for at udelukke lyttere generelt, men 10 svar, der afveg mere end 3 gange standardafvigelsen fra middelværdien, blev karakteriseret som outliers og udelukket. Ud fra en sammenligning af ekspertlytternes og testpanelets vurderinger kan det konkluderes, at spredningen generelt er mindre for eksperterne, men middelværdierne af eksperternes vurderinger og af panelets vurderinger ligger nær hinanden set i lyset af standardafvigelsernes størrelse. Som resultat af lyttetesten benyttes derfor middelværdierne af både panelets og eksperternes vurderinger. I et enkelt tilfælde synes det klart, at eksperterne bedre har kunnet skelne mellem det generelle lydbillede og den efterspurgte egenskab. Der er konstateret en høj korelation mellem parametrene "tydelig" og "påtrængende". Det er derfor valgt hovedsagelig at se på parameteren "tydelig" i det følgende. Korrelationen mellem "tydelig" og "gene" er til stede, men ikke udpræget, så de to parametre er relevante hver for sig. 5.6.3 Sammenhæng med laboratoriernes vurderingerDer er en acceptabel overensstemmelse mellem resultaterne af de 29 laboratoriers vurdering af, om der skal gives impulstillæg, og de valgte ekspertlytteres vurdering. Forskellene kan til dels forklares ud fra forskelle i lytteniveauet, så det må antages, at de vurderinger, der er foretaget i lytteforsøget sandsynligvis vil ligge på linie med vurderinger foretaget af de godkendte laboratorier under tilsvarende forhold. 5.6.4 Konkrete resultater af lyttetestenLydeksemplerne ved LAeq = 60 dB er i gennemsnit karakteriseret som 4,6 cm mere "generende" på den 15 cm lange geneakse end samme eksempler ved LAeq = 40 dB. Lydeksemplerne ved de to niveauer 40 og 60 dB rangordnes stort set ens med hensyn til impulsernes tydelighed. Den gennemsnitlige vurdering af impulsernes tydelighed ligger dog ca. 3,4 cm højere for 60 dB-eksemplerne. Dette resultat er forventeligt, da baggrundsstøjen i begge tilfælde var LAeq = 40 dB. Blandt ekspertlytterne er der en overvejende vurdering af, at der skal gives et 5 dB-impulstillæg, når impulsernes tydelighed overstiger 5-6 cm på svarskalaen for "tydelig". Variationen i "gene" er større for 40 dB-eksemplerne end for 60 dB-eksemplerne. Sammenhængen mellem "tydelig" og "gene" er ikke til stede i 60 dB-eksemplerne. |