TULogo
Inleiding
A. Spreken en horen
B. Theorie
B.1 Stralenmodel
B.2 Invoed geluidabsorptie
B.3 Geluidabsorberende materialen
B.4 Absorptie in tabelvorm
B.5 Veel absorptie ?
B.6 Nagalm Niveau Spraak
B.7 Geluidverstrooiing
B.8 Geluidfragmenten
B.9 Invloed volume
B.10 Afstand bron-waarnemer
B.11 Vorm van de ruimte
B.12 Positionering absorptiemateriaal
B.13 Plafondhoogte
B.14 Wanden in een sportzaal
B.15 GR: het atrium met omgeving
B.16 Geluidvoorbeelden atrium
B.17 GR: scherm en scheidingswand
B.21 Signaal en ruis
B.22 Maten spraakverstaanbaarheid
B.23 Spreekzalen
B.24 Meerdere sprekers
B.25 Bereken direct-stoorverhouding
B.26 Lombardeffect, geluidniveau
B.27 Meerdere sprekers in atrium
B.31 Muziekzaal, theorie
C. Absorptievoorbeelden
D. Ontwerpregels
E. PDF's
F. Artikelen
G. Colofon

Enige kenmerken van spraak en ruis

 
 
 

1.    Inleiding: spraakverstaanbaarheid

In de voorgaande theoriepagina's B1 t/m B17 zijn de akoestische eigenschappen behandeld van ruimten aan de hand van hun vorm en functie. Verreweg de belangrijkste factor is echter de hoeveelheid geluidabsorberend materiaal en (in iets mindere mate) de plaats waar de materialen worden aangebracht in de ruimte. De nu volgende webpagina's B.21 t/m B.27 gaan allemaal over de theorie van de spraakverstaanbaarheid en de mogelijkheden die een architect heeft om de spraakverstaanbaarheid in positieve zin te beïnvloeden. De daaruit volgende vuistregels zullen vooral in de webpagina's van deel D worden behandeld. En weer zal de invloed van geluidabsorptie overheersend zijn. De architectonische functie van een ruimte komt slechts impliciet aan de orde omdat we een tweedeling zullen maken tussen ruimtes voor één spreker (met het schoollokaal als belangrijkste vertegenwoordiger) en ruimtes met meerdere sprekers tegelijk.

De architectonische vorm heeft wel degelijk invloed op de spraakverstaanbaarheid. De grootte van de ruimte zal in de komende pagina's op meerdere plaatsen worden behandeld, maar de vorm blijft vrijwel steeds beperkt tot een rechthoekige ruimte. Afwijkende vormen in de gedaante van L-, U- en Z-vormige plattegronden zijn al behandeld in de voorgaande webpagina's B12, B14 en B15 [[1]].

 

Bij het spraakverstaan veronderstellen we altijd een "gewenste" spreker die we willen volgen. Dat is bijvoorbeeld een spreker in een spreekzaal, maar ook een spreker in een druk café dient te worden verstaan. De verstaanbaarheid van de spreker wordt op twee manieren verminderd: door de nagalm die de spreker zelf veroorzaakt en door ruis van andere geluidbronnen in de ruimte. De galm in de ruimte wordt beïnvloed door het volume van de ruimte en de hoeveelheid absorberende materiaal, maar dat geldt evenzo voor alle stoorgeluiden. Een ventilatiesysteem kan hinderlijk ruisen in een galmkamer, maar hetzelfde systeem kan vrijwel onhoorbaar zijn in een sterk gedempte ruimte. Dat geldt nog sterker voor meerdere sprekers in een ruimte, die passen namelijk ook nog eens de sterkte van hun spraak aan aan galm- en stoorniveau waardoor de invloed van absorptie nog sterker wordt.

 

De indeling van de volgende pagina's is als volgt:

  • In webpagina B.21 (de huidige dus) worden enkele kenmerken gegeven van spraak en ruis. Enkele geluidfragmenten demonstreren de invloed van geluidabsorptie op het spraakverstaan. In pagina B.21.1 worden de gebruikelijke geluidniveaus van spraak behandeld.

  • Het verstaan van spraak hangt af van de spreker, de toehoorder en de omgeving. Er zijn uiteraard individuele verschillen, maar toch is de akoestische wetenschap erop gespitst om "objectieve" maten te ontwikkelen die het "gemiddelde gedrag" kunnen voorspellen. Er zijn in de loop der jaren een paar maten in zwang geraakt die worden behandeld in webpagina B.22. Alle maten kunnen op twee manieren worden gebruikt: bij de meting van een bestaande ruimte of anderzijds juist in het ontwerpstadium om de kwaliteit van de spraak te kunnen voorspellen. De meest gebruikte (en meest accurate?) maat om te meten is de speech transmission index STI. De grootheid kan ook worden gebruikt voor voorspellingen, maar daartoe is eigenlijk een ray-tracing programma gewenst. Er is geen echt simpele methode waarmee STI zich voldoende nauwkeurig laat voorspellen. Daarom wordt in deze site ook veelvuldig gebruik gemaakt van de grootheid U50 die vooral stoelt op de verdeling tussen direct geluid, vroege reflecties, late reflecties en stoorgeluiden. In B.22.2, B.22.3 en B.22.4 worden beide grootheden in detail behandeld. Daaraan voorafgaand, in B.22.1, wordt aangetoond dat beide grootheden ongestraft door elkaar mogen worden gebruikt.

  • In webpagina B.23 wordt de "spreekzaal" behandeld, waarin één spreker met één of meerdere toehoorders zich verstaanbaar probeert te maken. De grootte van de ruimte varieert van huiskamer tot kathedraal, maar er zijn wel degelijk algemeen geldende richtlijnen te geven. Pagina B.23.2 behandelt die ruimten in detail. Daaraan voorafgaand, in B.23.1, wordt één specifieke ruimte behandeld: het schoollokaal met een vloeroppervlak van 50 m2. Dat gebeurt enerzijds omdat het belang van een goede akoestiek in een schoollokaal nauwelijks kan worden overschat, maar anderzijds kan de theorie van het schoollokaal daarna goed worden geëxtrapoleerd naar spreekzalen met andere afmetingen.
    Sprekers in spreekzalen kunnen allereerst last hebben van te veel nagalm, maar in spreekzalen hoort men ook altijd achtergrondgeluiden. De verhouding tussen gewenste spraak en het achtergrondgeluid (de signaal-ruisverhouding) komt ter sprake in pagina B.23.3, maar er zijn situaties (vooral in grotere zalen) waarin die verhouding alleen voldoende groot is te krijgen door toepassing van elektronische spraakversterking. Pagina B.23.4 behandelt die, zij het summier omdat het ontwerpen van een toespreekinstallatie vakwerk is hetgeen het vermogen van de gemiddelde architect te boven gaat.

  • In veel gevallen moet iemand worden verstaan in een ruimte met veel achtergrondgeluid. Voorbeelden zijn een fabriekshal met stampende machines, een café met luide muziek of een open kantoor met pratende collega's. In al die gevallen wordt de spraakverstaanbaarheid verbeterd als er zo veel mogelijk absorptiemateriaal wordt toegepast, maar het is lastig om er in algemene zin aan te rekenen omdat dan het geluidvermogen van de bron bekend moet zijn.
    Echter, als een spreker moet worden verstaan in een ruimte met andere sprekers is de bronsterkte wel bekend en is het mogelijk om de spraakverstaanbaarheid vrij nauwkeurig te voorspellen. Het is in drukke situaties zelfs mogelijk om een simpeler vorm van U50 toe te passen die we DS zullen noemen. Webpagina B.24 behandelt de algemene theorie; in de pagina's B.24.1 en B.24.2 worden de achterliggende formules behandeld. Pagina B.25 geeft vervolgens een aantal voorbeelden om met DS de spraakverstaanbaarheid te schatten.

  • Mensen gaan harder praten in lawaaiige situaties. Dat wordt meestal aangeduid met "cocktail-partyeffect" of met "Lombardeffect". De begrippen zullen beter worden omschreven in webpagina B.26 en B.26.1 t/m B.26.3. Dat theoriedeel mondt uit in een ontwerpgrafiek annex formule die het geluidniveau beschrijft van een aantaal sprekende mensen in verhouding tot het totaal absorberend oppervlak in die ruimte. Meer gegevens zijn niet nodig.

  • Webpagina B.27 geeft een voorbeeld van de spraakverstaanbaarheid in een atrium met aanliggende open verdiepingen. Het is een tamelijk willekeurig voorbeeld, maar atria zijn in de architectonische mode en kunnen makkelijk leiden tot geluidhinder op de verdiepingsvloeren. Dat is de reden om het onderwerp in dit theoriedeel te behandelen.

 

2.    "Het" geluidniveau van spraak

Geluid fluctueert altijd in amplitude [[2]], hetgeen betekent dat er gemiddeld moet worden om er een getal aan te kunnen toekennen [[3]]. In geluidmeters is veelal een middeling van 1/8-ste s of 1.0 s ingebouwd, respectievelijk voor de stand “fast” of “slow”, maar daarmee kan "een dag op school" niet worden gekarakteriseerd.

Langs bijvoorbeeld een autoweg variëren de niveaus ten gevolge van afzonderlijk passerende auto’s en de verkeersintensiteit varieert over het etmaal. Daarom wordt in de Wet geluidhinder een gewogen middeling over een geheel etmaal voorgeschreven. Rond vliegvelden wordt zelfs gemiddeld over een heel jaar; dan kan bijvoorbeeld op Schiphol in november het jaarrantsoen op zijn [[4]]. Maar voor spraak is er eigenlijk geen eenduidig voorgeschreven methode. De middeling geschiedt min of meer zoals bij verkeerslawaai, maar de periode waarover wordt gemiddeld ligt niet vast in normbladen en in de literatuur kan men allerlei methoden tegenkomen.

 

Figuur 1 toont de geluiddruk van een zin van bijna 5 s die is gesproken in een zeer stille ruimte. Ruis is dan onhoorbaar [[5]]. De fijnstructuur van het signaal is onzichtbaar, maar is wel degelijk aanwezig. Die fijnstructuur wordt duidelijk als wordt ingezoomd op een kortere tijdspanne. De onderste figuur geeft de eerste 0.35 s van het signaal waarin de afzonderlijke frekwenties van de spraak zichtbaar zijn.

Figuur 1:  Een voorbeeld van de geluiddruk van spraak (boven). Alleen de modulaties zijn op deze tijdschaal te zien. De tonale fijnstructuur is pas zichtbaar, als wordt ingezoomd op een deel van het signaal. Dat wordt getoond in de onderste figuur.

 

Indien wordt gemiddeld om een geluidniveau te bepalen, verdwijnt de fijnstructuur als eerste; juist de omhullende (de "modulatie") wordt dan benadrukt. In figuur 2 zien we veel meer terug van de bovenste figuur dan van de onderste.

Figuur 2:  De geluidniveaus in dB na bewerking van het signaal uit figuur 1-boven. De fijnstructuur is nu geheel verdwenen, maar de omhullende is nog te herkennen. De blauwe curve is gemiddeld met de stand "fast" van een geluidmeter, de groene curve geldt voor de stand "slow". De rode stippellijn tont een middeling over de gehele periode van 5 s.

 

De rode stippellijn geeft een middeling over de gehele zin. Het geluidniveau over die periode is dus ruim 56 dB. Die waarde kan karakteristiek worden genoemd voor de desbetreffende spreker, maar uiteraard komt er net weer wat anders uit als de spreker een andere zin uitspreekt.

Een groot vraagteken is verder nog hoe bijvoorbeeld het geluidniveau in een schoolklas kan worden gekarakteriseerd. In de literatuur vindt men soms een meetperiode van 1 minuut; er wordt ook wel gemiddeld over een gehele lesperiode. Helaas wordt dan (door de logaritmische middeling) het geluidniveau sterk bepaald door de maxima in de periode. Indien een stel kinderen joelend het lokaal binnenkomt, is dat niet meer met een half uur rustig werken te compenseren; bovendien valt er altijd nog wel een stoel om. Getallen van 80 of zelfs 90 dB, zoals wel gemeld in de literatuur, dienen dan ook zeer kritisch te worden beschouwd [[6]].

 

De waarde van ca. 56 dB(A) uit figuur 2 vinden we in de dode kamer als iemand spreekt tot een toehoorder op 1 m, al zijn er uiteraard verschillen tussen sprekers onderling. Bovendien kan iemand spreken met “stemverheffing”, iemand kan “luid” spreken of zelfs “schreeuwen". Het is dan gebruikelijk om daarbij uit te gaan van stappen van 6 dB(A). De waarden van tabel 1 kunnen worden gevonden in de literatuur.

 

Tabel 1:  De geluidniveaus in dB(A), gemeten op 1 m recht voor de mond in een dode kamer. Ontleend aan het handboek lawaaibeheersing [[7]].

Ontspannen [[8]]

54

Normaal

60

Stemverheffing

66

Luid

72

Zeer Luid

78

Schreeuwen

84

Maximaal Schreeuwen

90

 

Het ligt er maar aan wat men precies onder "normale" spraak verstaat, maar de waarde van 60 dB is echt luider dan de conversatiespraak uit onze eigen dode-kamermetingen aan meerdere proefpersonen. We zullen op de discrepanties nader ingaan in de theoriepagina B.21.1.

 

3.    Stoorniveaus

Als wij het geluid van spraak waarnemen, is er altijd sprake van achtergrondruis; een bron in absolute stilte bestaat niet. Bij achtergrondlawaai is de spreiding nog veel groter dan bij spraak, omdat het geluidniveau sterk varieert per situatie. Het achtergrondniveau in een muisstil kantoor bedraagt 30 dB [[9]]; enige activiteit (geschuifel van voeten, geblader in papieren) en een licht ruisende computer veroorzaken ongeveer 40 dB. Het ruisniveau in bijvoorbeeld een restaurant kan sterk variëren doordat het aantal aanwezigen varieert, maar ook de aankleding van de ruimte speelt een grote rol. Enig geroezemoes leidt al snel tot een geluidniveau van 50 dB. Het maximum ligt bij ca. 80 dB in een galmende ruimte, maar wordt nog hoger als er luide muziek wordt gespeeld [[10]]. Een spreker van 56 dB is in een rustig restaurant dus goed te verstaan; een signaal-ruisverhouding van 6 dB is voor dergelijke situaties goed genoeg [[11]]. In het lawaaiige restaurant zal de spreker zijn/haar stem moeten verheffen en/of de toehoorder veel dichter moeten naderen; een waarde van 56 dB op 1 m komt in theorie overeen met 76 dB op 10 cm. Maar in het lawaaiigste restaurant is de signaal-ruisverhouding negatief en de spreker krijgt de neiging om (veel) luider te gaan praten. Echt schreeuwen in elkaars oren is meestal pas nodig indien er ook muziek wordt gemaakt. Het effect van stemverheffing zullen we in deze site aanduiden met "Lombardeffect". Het komt in de volgende pagina's aan bod.

 

4.    Signaal-ruisverhouding

De signaal-ruisverhouding SN is het verschil tussen het geluid(druk)niveau van het "gewenste" geluid Lgew en het geluid(druk)niveau van de stoorbron Lruis. In formulevorm wordt dat geschreven als [[12]]:

 

(1)

 

In de praktijk zijn SN-waarden van 15 dB en hoger ideaal voor spraak. Maar spraak is ook nog redelijk te verstaan bij SN = 0 dB. Spraak mag als onverstaanbaar worden beschouwd indien SN lager is dan -9 dB. Echter, bij muziekopnamen zijn dit soort waarden absoluut onvoldoende. Dan worden SN-waarden boven 60 dB nagestreefd.

 

Formule (1) mag de simpelste formule uit de akoestiek worden genoemd. Dat betekent echter nog niet dat de waarden van Lgew en Lruis eenvoudig te bepalen zijn. Stel bijvoorbeeld dat we in een restaurant een gewenste spreker proberen te verstaan tegen een achtergrond van andere sprekers. In een druk restaurant is het ruisniveau meestal aardig constant en een meting van Lruis met een geluidmeter kan dan vrij simpel geschieden door de gewenste spreker even te laten zwijgen. Dan nog is het geluidniveau een momentopname, want in de loop van de avond tijd zal het aantal gasten variëren. Maar hoe bepalen we eigenlijk Lgew? We zouden de spreker kunnen vragen om nogmaals te spreken in een leeg restaurant, maar de spreker spreekt dan ongetwijfeld zachter en de akoestische absorptie van de ruimte zal afnemen bij afwezigheid van de andere gasten.

Een ander voorbeeld is een leerkracht die lesgeeft in de buurt van een vliegveld waar regelmatig vliegtuigen overkomen. Het is lastig om bij fluctuerend geluid het ruisniveau te karakteriseren, maar bovendien valt te verwachten dat de leerkracht zijn of haar geluidniveau bij iedere vliegtuigpassage zal verhogen, juist om een afnemende SN-waarde te compenseren. Wellicht moet de leerkracht af en toe zelfs zwijgen.

 

5.    De invloed van absorptie in een ruimte

In de voorgaande pagina's is al vele malen uitgelegd dat de geluidabsorptie van een ruimte invloed heeft op het geluidniveau. Daartoe werden in pagina B.8 twee extremen vergeleken: de nagalmkamer en de geluiddode kamer. De resultaten worden in tabel 2 herhaald. Het voorbeeld geeft viermaal dezelfde spreker en laat zien dat in de dode kamer de invloed van de afstand veel groter is dan in de galmkamer.

 

Tabel 2: De amplitude van spraak als functie van de tijd. De spreker bevindt zich in de dode kamer (situaties A en B) of in de nagalmkamer (C en D), telkens op 1 m van de mikrofoon (A en C) of op 5 m (B en D).

KOPIE uit het site-deel Geluidfragmenten. De eigenlijke geluidfragmenten zijn hier weggelaten.

A

dode kamer

op 1m

B

dode kamer

op 5 m

C

Nagalmkamer

op 1m

D

Nagalmkamer

op 5 m

 

Stel nu dat een "gewenste" spreker op 1 m staat van de toehoorder en dat zich op 5 m een stoorspreker bevindt met hetzelfde geluidniveau (figuur 4). Dan blijkt uit tabel 2 dat de invloed van de stoorspreker in de galmkamer veel storender is. De voorbeelden A en C op 1 m kunnen nl. aan de gewenste spreker worden toegekend en de voorbeelden B en D op 5 m aan de stoorspreker. Het verschil in geluidniveau tussen A en B (dat is dus de signaal-ruisverhouding in een dode kamer) is nu veel groter dan tussen C en D (idem in een galmkamer) en dat betekent dat de signaal-ruisverhouding veel beter is in een ruimte met veel geluidabsorptie.

Figuur 4:  Een voorbeeld van een "gewenste" spreker op 1 m en één stoorspreker op 5 m.

 

Om het effect hoorbaar te maken zijn twee geluidfragmenten toegevoegd. Het is dit keer aan te bevelen om eerst het fragment uit de galmkamer te beluisteren [[13]].

A

nagalmkamer

spreker op 1 m
radio op 5 m

B

dode kamer

spreker op 1 m
radio op 5 m

 

 

Het voorbeeld kan rechtstreeks worden vertaald naar bijvoorbeeld een restaurant. De gewenste spreker zal zich vaak binnen 1 m bevinden. De sterkte van dat gewenste geluid wordt niet of nauwelijks beïnvloed door de absorptie van de ruimte. De meeste (of alle) sprekers bevinden zich op grotere afstand, zodat toevoeging van absorptie hun geluidniveau omlaag brengt. De signaal-ruisverhouding verbetert daardoor.

 

 

 


[1]    Toegegeven, dat is de omgekeerde volgorde, maar soms (of vaak?) is educatie geen lineair proces.

[2]     Anders hoorden we namelijk niets. Ons oor kan geen absolute druk waarnemen maar alleen fluctuaties.

[3]     Voor de details wende men zich tot de elders genoemde literatuur. Hier zij vermeld dat een middeling altijd geschiedt over het vermogen van het geluid.

[4]     Hetgeen overigens ook weer niet betekent dat het vliegverkeer wordt stilgelegd. Daarvoor is de macht van Schiphol te groot.

[5]     De belangrijkste ruisbron tijdens stiltes is de ademhaling van de spreker. Moet dat worden toegerekend aan de spraak of aan de ruis?

[6]     Zelf maken we graag gebruik van mediane waarden uit een grote serie van metingen van bijvoorbeeld 1 of 5 s; de pieken vallen er dan uit. Die methode is echter niet in de officiële stukken terug te vinden.  

[7]     De tabel is gebaseerd op de ANSI-norm voor menselijke spraak en wordt gegeven in:

H. J. M. Steeneken, “Spraakcommunicatie”,  in: “Lawaaibeheersing, Handboek voor Milieubeheer”, Kluwer, Jarenlang was dit een losbladig systeem met papieren updates; tegenwoordig gaat dat via CD’s en een website. Een jaartal is er daarom niet aan toe te kennen.

[8]     Men zou verwachten dat menselijke spraak zeer zacht kan zijn. Dat klopt voor fluisteren waarbij de stembanden niet worden gebruikt. Zodra echter de stembanden wel meedoen is er een minimum aan het geluidniveau.

[9]     Zoals steeds in deze site staat de aanduiding dB voor het A-gewogen geluidniveau, tenzij anders vermeld.

[10]   M. Hodgson, G. Steininger, Z. Razavi, “Measurement and prediction of speech and noise levels and the Lombard effect in eating establishments”, J. Acoust. Soc. Am, 121, 2023-2033 (2007).

[11]   Het direct e geluid en het stoorniveau worden simpelweg afgetrokken. Zo'n berekening is wel erg kort door de bocht, maar werkt prima voor een eerste schatting in bijvoorbeeld een restaurant. In een schoolklas is de berekening te onnauwkeurig.

[12]   Het lag in de bedoeling om deze stroom binnen de site te vrijwaren van formules, maar deze moet toch wel kunnen.

[13]   Het zal de andere fans van Van Morrison pijn doen dat zijn muziek als “stoorlawaai” wordt beschouwd. Mijn excuses.