1. Inleiding: spraakverstaanbaarheid
In de voorgaande theoriepagina's B1 t/m B17 zijn de
akoestische eigenschappen behandeld van ruimten aan de hand van hun vorm en
functie. Verreweg de belangrijkste factor is echter de hoeveelheid
geluidabsorberend materiaal en (in iets mindere mate) de plaats waar de
materialen worden aangebracht in de ruimte. De nu volgende webpagina's B.21 t/m
B.27 gaan allemaal over de theorie van de spraakverstaanbaarheid en de
mogelijkheden die een architect heeft om de spraakverstaanbaarheid in positieve
zin te beïnvloeden. De daaruit volgende vuistregels zullen vooral in de webpagina's van
deel D worden behandeld. En weer zal de invloed van geluidabsorptie overheersend
zijn. De architectonische functie
van een ruimte komt slechts impliciet aan de orde omdat we een tweedeling zullen maken
tussen ruimtes voor één spreker (met het schoollokaal als belangrijkste
vertegenwoordiger) en ruimtes met meerdere sprekers tegelijk.
De architectonische vorm heeft wel degelijk
invloed op de spraakverstaanbaarheid. De grootte van de ruimte zal in de komende
pagina's op meerdere plaatsen worden behandeld, maar de vorm blijft vrijwel
steeds beperkt tot een rechthoekige ruimte. Afwijkende vormen in de gedaante van L-,
U- en Z-vormige plattegronden zijn al behandeld in de voorgaande webpagina's B12, B14 en B15 [[1]].
Bij het spraakverstaan veronderstellen we altijd een
"gewenste" spreker die we willen volgen. Dat is bijvoorbeeld een spreker
in een spreekzaal, maar ook een spreker in een druk café dient te worden
verstaan. De verstaanbaarheid van de
spreker wordt op twee manieren verminderd: door de nagalm die de spreker zelf
veroorzaakt en door ruis van andere geluidbronnen in de ruimte. De galm in de
ruimte wordt beïnvloed door het volume van de ruimte en de hoeveelheid
absorberende materiaal, maar dat geldt evenzo voor alle stoorgeluiden. Een
ventilatiesysteem kan hinderlijk ruisen in een galmkamer, maar hetzelfde
systeem kan vrijwel onhoorbaar zijn in een sterk gedempte ruimte. Dat geldt nog
sterker voor meerdere sprekers in een ruimte, die passen namelijk ook nog eens
de sterkte van hun spraak aan aan galm- en stoorniveau waardoor de invloed van
absorptie nog sterker wordt.
De indeling van de volgende pagina's is als volgt:
-
In webpagina B.21 (de huidige dus) worden enkele
kenmerken gegeven van spraak en ruis. Enkele geluidfragmenten demonstreren de
invloed van geluidabsorptie op het spraakverstaan. In pagina B.21.1
worden de gebruikelijke geluidniveaus van spraak behandeld.
-
Het verstaan van spraak hangt af van de spreker, de
toehoorder en de omgeving. Er zijn uiteraard individuele verschillen, maar toch
is de akoestische wetenschap erop gespitst om "objectieve" maten te
ontwikkelen die het "gemiddelde gedrag" kunnen voorspellen. Er zijn
in de loop der jaren een paar maten in zwang geraakt die worden behandeld in webpagina
B.22. Alle maten kunnen op twee manieren worden gebruikt: bij de meting van
een bestaande ruimte of anderzijds juist in het ontwerpstadium om de kwaliteit
van de spraak te kunnen voorspellen. De meest gebruikte (en meest accurate?)
maat om te meten is de speech transmission index STI. De grootheid kan ook
worden gebruikt voor voorspellingen, maar daartoe is eigenlijk een ray-tracing programma gewenst. Er is geen
echt simpele methode waarmee STI zich voldoende nauwkeurig
laat voorspellen. Daarom wordt in deze site ook veelvuldig gebruik gemaakt van
de grootheid U50 die vooral stoelt op de verdeling tussen
direct geluid, vroege reflecties, late reflecties en stoorgeluiden. In B.22.2, B.22.3
en B.22.4 worden beide grootheden in detail behandeld. Daaraan
voorafgaand, in B.22.1, wordt aangetoond dat beide grootheden ongestraft
door elkaar mogen worden gebruikt.
-
In webpagina B.23 wordt de "spreekzaal"
behandeld, waarin één spreker met één of meerdere toehoorders zich verstaanbaar
probeert te maken. De grootte van de ruimte varieert van huiskamer tot
kathedraal, maar er zijn wel degelijk algemeen geldende richtlijnen te geven. Pagina
B.23.2 behandelt die ruimten in detail. Daaraan voorafgaand, in B.23.1,
wordt één specifieke ruimte behandeld: het schoollokaal met een vloeroppervlak van 50 m2.
Dat gebeurt enerzijds
omdat het belang van een goede akoestiek in een schoollokaal nauwelijks kan
worden overschat, maar anderzijds kan de theorie van het schoollokaal daarna
goed worden geëxtrapoleerd naar spreekzalen met andere afmetingen.
Sprekers in spreekzalen kunnen allereerst last hebben van te veel nagalm, maar
in spreekzalen hoort men ook altijd achtergrondgeluiden. De verhouding tussen
gewenste spraak en het achtergrondgeluid (de signaal-ruisverhouding) komt ter
sprake in pagina B.23.3, maar er zijn situaties (vooral in grotere
zalen) waarin die verhouding alleen voldoende groot is te krijgen door
toepassing van elektronische spraakversterking. Pagina B.23.4 behandelt
die, zij het summier omdat het ontwerpen van een toespreekinstallatie vakwerk
is hetgeen het vermogen van de gemiddelde architect te boven gaat.
-
In veel gevallen moet iemand worden verstaan in een
ruimte met veel achtergrondgeluid. Voorbeelden zijn een fabriekshal met
stampende machines, een café met luide muziek of een open kantoor met pratende
collega's. In al die gevallen wordt de spraakverstaanbaarheid verbeterd als er
zo veel mogelijk absorptiemateriaal wordt toegepast, maar het is lastig om er
in algemene zin aan te rekenen omdat dan het geluidvermogen van de bron
bekend moet zijn.
Echter, als een spreker moet worden verstaan in een ruimte met andere
sprekers is de bronsterkte wel bekend en is het mogelijk om de
spraakverstaanbaarheid vrij nauwkeurig te voorspellen. Het is in drukke
situaties zelfs mogelijk om een simpeler vorm van U50 toe te
passen die we DS zullen noemen. Webpagina B.24 behandelt de
algemene theorie; in de pagina's B.24.1 en B.24.2 worden de
achterliggende formules behandeld. Pagina B.25 geeft vervolgens een
aantal voorbeelden om met DS de spraakverstaanbaarheid te schatten.
-
Mensen gaan harder praten in lawaaiige situaties. Dat
wordt meestal aangeduid met "cocktail-partyeffect" of met
"Lombardeffect". De begrippen zullen beter worden omschreven in webpagina
B.26 en B.26.1 t/m B.26.3. Dat theoriedeel mondt uit in een ontwerpgrafiek
annex formule die het geluidniveau beschrijft van een aantaal sprekende mensen
in verhouding tot het totaal absorberend oppervlak in die ruimte. Meer gegevens
zijn niet nodig.
-
Webpagina B.27 geeft een voorbeeld van de
spraakverstaanbaarheid in een atrium met aanliggende open verdiepingen. Het is
een tamelijk willekeurig voorbeeld, maar atria zijn in de architectonische mode
en kunnen makkelijk leiden tot geluidhinder op de verdiepingsvloeren. Dat is de
reden om het onderwerp in dit theoriedeel te behandelen.
2. "Het" geluidniveau van spraak
Geluid fluctueert altijd in amplitude [[2]],
hetgeen betekent dat er gemiddeld moet worden om er een getal aan te kunnen
toekennen [[3]].
In geluidmeters is veelal een middeling van 1/8-ste s of 1.0 s ingebouwd,
respectievelijk voor de stand “fast” of “slow”, maar daarmee kan "een dag
op school" niet worden gekarakteriseerd.
Langs bijvoorbeeld een autoweg variëren de niveaus ten
gevolge van afzonderlijk passerende auto’s en de verkeersintensiteit varieert
over het etmaal. Daarom wordt in de Wet geluidhinder een gewogen middeling over
een geheel etmaal voorgeschreven. Rond vliegvelden wordt zelfs gemiddeld over
een heel jaar; dan kan bijvoorbeeld op Schiphol in november het jaarrantsoen op
zijn [[4]].
Maar voor spraak is er eigenlijk geen eenduidig voorgeschreven methode. De
middeling geschiedt min of meer zoals bij verkeerslawaai, maar de periode
waarover wordt gemiddeld ligt niet vast in normbladen en in de literatuur kan
men allerlei methoden tegenkomen.
Figuur 1 toont de geluiddruk van
een zin van bijna 5 s die is gesproken in een zeer stille ruimte. Ruis is dan
onhoorbaar [[5]].
De fijnstructuur van het signaal is onzichtbaar, maar is wel degelijk aanwezig.
Die fijnstructuur wordt duidelijk als wordt ingezoomd op een kortere
tijdspanne. De onderste figuur geeft de eerste 0.35 s van het signaal waarin de
afzonderlijke frekwenties van de spraak zichtbaar zijn.


Figuur 1: Een voorbeeld van de geluiddruk van spraak
(boven). Alleen de modulaties zijn op deze tijdschaal te zien. De tonale
fijnstructuur is pas zichtbaar, als wordt ingezoomd op een deel van het
signaal. Dat wordt getoond in de onderste figuur.
Indien wordt gemiddeld om een geluidniveau te bepalen,
verdwijnt de fijnstructuur als eerste; juist de omhullende (de
"modulatie") wordt dan benadrukt. In figuur 2 zien we veel meer terug
van de bovenste figuur dan van de onderste.

Figuur 2: De geluidniveaus in dB na bewerking van het
signaal uit figuur 1-boven. De fijnstructuur is nu geheel verdwenen, maar de
omhullende is nog te herkennen. De blauwe curve is gemiddeld met de stand
"fast" van een geluidmeter, de groene curve geldt voor de stand
"slow". De rode stippellijn tont een middeling over de gehele periode
van 5 s.
De rode stippellijn geeft een middeling over de gehele
zin. Het geluidniveau over die periode is dus ruim 56 dB. Die waarde kan
karakteristiek worden genoemd voor de desbetreffende spreker, maar uiteraard
komt er net weer wat anders uit als de spreker een andere zin uitspreekt.
Een groot vraagteken is verder nog hoe bijvoorbeeld het
geluidniveau in een schoolklas kan worden gekarakteriseerd. In de literatuur
vindt men soms een meetperiode van 1 minuut; er wordt ook wel gemiddeld over
een gehele lesperiode. Helaas wordt dan (door de logaritmische middeling) het
geluidniveau sterk bepaald door de maxima in de periode. Indien een stel
kinderen joelend het lokaal binnenkomt, is dat niet meer met een half uur
rustig werken te compenseren; bovendien valt er altijd nog wel een stoel om.
Getallen van 80 of zelfs 90 dB, zoals wel gemeld in de literatuur, dienen dan
ook zeer kritisch te worden beschouwd [[6]].
De waarde van ca. 56 dB(A) uit figuur 2 vinden we in de
dode kamer als iemand spreekt tot een toehoorder op 1 m, al zijn er uiteraard verschillen
tussen sprekers onderling. Bovendien kan iemand spreken met “stemverheffing”,
iemand kan “luid” spreken of zelfs “schreeuwen". Het is dan gebruikelijk om
daarbij uit te gaan van stappen van 6 dB(A). De waarden van tabel 1 kunnen
worden gevonden in de literatuur.
Tabel 1: De geluidniveaus in dB(A), gemeten op 1 m recht
voor de mond in een dode kamer. Ontleend aan het handboek lawaaibeheersing [[7]].
Ontspannen [[8]]
|
54
|
Normaal
|
60
|
Stemverheffing
|
66
|
Luid
|
72
|
Zeer Luid
|
78
|
Schreeuwen
|
84
|
Maximaal Schreeuwen
|
90
|
Het ligt er maar aan wat men precies onder
"normale" spraak verstaat, maar de waarde van 60 dB is echt luider
dan de conversatiespraak uit onze eigen dode-kamermetingen aan meerdere
proefpersonen. We zullen op de discrepanties nader ingaan in de theoriepagina
B.21.1.
3. Stoorniveaus
Als wij het geluid van spraak waarnemen, is er altijd
sprake van achtergrondruis; een bron in absolute stilte bestaat niet. Bij achtergrondlawaai
is de spreiding nog veel groter dan bij spraak, omdat het geluidniveau sterk
varieert per situatie. Het achtergrondniveau in een muisstil kantoor bedraagt
30 dB [[9]];
enige activiteit (geschuifel van voeten, geblader in papieren) en een licht
ruisende computer veroorzaken ongeveer 40 dB. Het ruisniveau in bijvoorbeeld een
restaurant kan sterk variëren doordat het aantal aanwezigen varieert, maar ook
de aankleding van de ruimte speelt een grote rol. Enig geroezemoes leidt al
snel tot een geluidniveau van 50 dB. Het maximum ligt bij ca. 80 dB in een
galmende ruimte, maar wordt nog hoger als er luide muziek wordt gespeeld [[10]].
Een spreker van 56 dB is in een rustig restaurant dus goed te verstaan; een signaal-ruisverhouding
van 6 dB is voor dergelijke situaties goed genoeg [[11]]. In
het lawaaiige restaurant zal de spreker zijn/haar stem moeten verheffen en/of
de toehoorder veel dichter moeten naderen; een waarde van 56 dB op 1 m komt in
theorie overeen met 76 dB op 10 cm. Maar in het lawaaiigste restaurant is de
signaal-ruisverhouding negatief en de spreker krijgt de neiging om (veel)
luider te gaan praten. Echt schreeuwen in elkaars oren is meestal pas nodig
indien er ook muziek wordt gemaakt. Het effect van stemverheffing zullen we in
deze site aanduiden met "Lombardeffect". Het komt in de volgende
pagina's aan bod.
4. Signaal-ruisverhouding
De signaal-ruisverhouding SN is het verschil
tussen het geluid(druk)niveau van het "gewenste" geluid Lgew
en het geluid(druk)niveau van de stoorbron Lruis. In
formulevorm wordt dat geschreven als [[12]]:
|

|
(1)
|
In de praktijk zijn SN-waarden van 15 dB en hoger ideaal
voor spraak. Maar spraak is ook nog redelijk te verstaan bij SN = 0 dB.
Spraak mag als onverstaanbaar worden beschouwd indien SN lager is dan -9
dB. Echter, bij muziekopnamen zijn dit soort waarden absoluut onvoldoende. Dan
worden SN-waarden boven 60 dB nagestreefd.
Formule (1) mag de simpelste formule uit de akoestiek
worden genoemd. Dat betekent echter nog niet dat de waarden van Lgew
en Lruis eenvoudig te bepalen zijn. Stel bijvoorbeeld dat we in
een restaurant een gewenste spreker proberen te verstaan tegen een achtergrond
van andere sprekers. In een druk restaurant is het ruisniveau meestal aardig
constant en een meting van Lruis met een geluidmeter kan dan
vrij simpel geschieden door de gewenste spreker even te laten zwijgen. Dan nog
is het geluidniveau een momentopname, want in de loop van de avond tijd zal het
aantal gasten variëren. Maar hoe bepalen we eigenlijk Lgew?
We zouden de spreker kunnen vragen om nogmaals te spreken in een leeg
restaurant, maar de spreker spreekt dan ongetwijfeld zachter en de akoestische
absorptie van de ruimte zal afnemen bij afwezigheid van de andere gasten.
Een ander voorbeeld is een leerkracht die lesgeeft in de
buurt van een vliegveld waar regelmatig vliegtuigen overkomen. Het is lastig om
bij fluctuerend geluid het ruisniveau te karakteriseren, maar bovendien valt te
verwachten dat de leerkracht zijn of haar geluidniveau bij iedere
vliegtuigpassage zal verhogen, juist om een afnemende SN-waarde te
compenseren. Wellicht moet de leerkracht af en toe zelfs zwijgen.
5. De invloed van absorptie in een ruimte
In de voorgaande pagina's is al vele malen uitgelegd dat
de geluidabsorptie van een ruimte invloed heeft op het geluidniveau. Daartoe
werden in pagina B.8 twee extremen vergeleken: de nagalmkamer en de geluiddode
kamer. De resultaten worden in tabel 2 herhaald. Het voorbeeld geeft viermaal
dezelfde spreker en laat zien dat in de dode kamer de invloed van de afstand
veel groter is dan in de galmkamer.
Tabel 2: De amplitude van spraak als functie van de tijd.
De spreker bevindt zich in de dode kamer (situaties A en B) of in de
nagalmkamer (C en D), telkens op 1 m van de mikrofoon (A en C) of op 5 m (B en
D).
KOPIE uit het site-deel Geluidfragmenten. De eigenlijke
geluidfragmenten zijn hier weggelaten.
A
dode kamer
op 1m
|

|
B
dode kamer
op 5 m
|

|
C
Nagalmkamer
op 1m
|

|
D
Nagalmkamer
op 5 m
|

|
Stel nu dat een "gewenste"
spreker op 1 m staat van de toehoorder en dat zich op 5 m een stoorspreker
bevindt met hetzelfde geluidniveau (figuur 4). Dan blijkt uit tabel 2 dat de
invloed van de stoorspreker in de galmkamer veel storender is. De voorbeelden A
en C op 1 m kunnen nl. aan de gewenste spreker worden toegekend en de
voorbeelden B en D op 5 m aan de stoorspreker. Het verschil in geluidniveau tussen
A en B (dat is dus de signaal-ruisverhouding in een dode kamer) is nu veel
groter dan tussen C en D (idem in een galmkamer) en dat betekent dat de signaal-ruisverhouding
veel beter is in een ruimte met veel geluidabsorptie.

Figuur 4: Een voorbeeld van een "gewenste"
spreker op 1 m en één stoorspreker op 5 m.
Om het effect hoorbaar te maken zijn twee
geluidfragmenten toegevoegd. Het is dit keer aan te bevelen om eerst het
fragment uit de galmkamer te beluisteren [[13]].
A
nagalmkamer
spreker op 1 m
radio op 5 m
|
… Muziek
…………………….
“Ik sta hier in de nagalmkamer op 1 m afstand van
de mikrofoon. Op 5 meter afstand van de mikrofoon bevindt zich een spelend
radiootje. Kunt U mij nog verstaan?”
… Muziek
…………………….
|
B
dode kamer
spreker op 1 m
radio op 5 m
|
… Muziek
……………………
“We bevinden ons in de dode kamer. Op 5 meter
afstand van de mikrofoon staat een spelende radio; zelf sta ik op 1 m van de
mikrofoon. U merkt wel dat de radio hier minder hinderlijk is dan in de
nagalmkamer.
… Muziek
……………………
|
Het voorbeeld kan rechtstreeks worden vertaald naar
bijvoorbeeld een restaurant. De gewenste spreker zal zich vaak binnen 1 m
bevinden. De sterkte van dat gewenste geluid wordt niet of nauwelijks beïnvloed
door de absorptie van de ruimte. De meeste (of alle) sprekers bevinden zich op
grotere afstand, zodat toevoeging van absorptie hun geluidniveau omlaag brengt.
De signaal-ruisverhouding verbetert daardoor.