Skalierung der Empfindungen

Skalierung der Frequenzempfindung

Die physikalische Größe Frequenz hängt in erster Linie mit der Empfindungsgröße Tonhöhe zusammen. ein Sinuston mit hoher Frequenz wird auch als ein Ton mit hoher Tonhöhe wahrgenommen.
1935 hat S.S.STEVENS gemessen, dass die wahrgenommene Tonhöhe auch von der Schallintensität abhängt. 2500Hz scheinen hierbei eine Grenze zu markieren. Unterhalb dieses Wertes verursacht eine Intensitätserhöhung eine Reduktion der wahrgenommenen Tonhöhe, oberhalb diese Wertes wirkt eine zunehmende Intensität jedoch entgegengesetzt. Dies scheint jedoch nur bei reinen Sinustönen so zu sein. Auch die Signaldauer beeinflusst die Tonhöhenwahrnehmung. Unterhalb von 1kHz stellt sich die Wahrnehmung erst nach 6±3 Perioden (des Sinustones) ein, oberhalb davon ist wohl eine bestimmte minimale Signaldauer erforderlich. Es gibt vier verschiedene Ansätze für die quantitative Bestimmung der Zusammenhänge zwischen Frequenz und Tonhöhe:

1. Eben wahrnehmbare Frequenzänderung (SPINC-Skala)

Um mit einer einfachen Methode eine Skalierung der Empfindungsgröße Tonhöhe abzuleiten, werden Versuchspersonen zwei Sinustöne in kurzem zeitlichen Abstand präsentiert. Die Probanden müssen entscheiden, ob sich deren Frequenz unterscheidet oder nicht (Diskrimationstest). Durch dieses Verfahren lassen sich die Reizstufen, also die eben wahrnehmbaren Frequenzänderungen, feststellen. Hierbei zeigen sich wahrnehmbare Unterscheidungsschwellen von 1Hz für Sinustöne unter 500Hz. Oberhalb dieses Wertes ist die Unterscheidungsschwelle frequenzabhängig und beträgt etwa 0,2% der Signalfrequenz. Ein 10.000Hz Ton ist demnach nicht von einem 10.190Hz Ton zu unterscheiden. Dieser Effekt ist auch lautstärkeabhängig, bei Sinustönen 5 bis 10dB über der Ruhehörschwelle verschlechtert sich das Frequenzauflösungvermögen beträchtlich.
Bei einer zweiten Methode verwendete ZWICKER 1982 frequenzmodulierte Sinustöne. Nach diesem Experiment liegt die Unterscheidunsschwelle bei Sinustönen unter 500Hz bei 3,6Hz und steigt dann mit 0,7% der Frequenz an. Hier offenbart sich also eine schlechtere auditive Frequenzauflösung, und damit Wahrnehmung, bei Modulationen als bei sequentiellen Unterschieden.
TERHARDT 1998 approximiert die Kurven mehrerer Tetsreihen durch eine Funktion der gerade wahrnehmbaren Frequenzänderung ΔfD von der Frequenz f:

 ΔfD(f) = 1+0,5*f² Hz ; ΔfD in Hz, f in [kHz]

Hierraus kann man eine Empfindungsskala gewinnen, auf der ein Schritt immer gleich einer eben wahrnehmbaren Frequenzänderung (SPINC = spectral pitch increment) ist. Ein solcher schritt wird 1SPINC genannt. Aus der obigen Formel lässt sich eine Transformation der physikalischen Frequenzskala f auf der SPINC-Skala Φ ableiten:

 Φ (f) = 1414*arctan(f/1414) ; Φ in [SPINC], f in [Hz]

 

2. Tonhöhe (mel-Skala)

Tonhöhe ist das eigentliche Empfindungskorrelat zur physikalischen Größe Frequenz. Um eine Empfindungsfunktion zu konstruieren, muss man beobachten, welche Frequenzerhöhung zu einer Verdopplung der empfundenen Tonhöhe führt. S.S.STEVENS führte 1937 Experimente durch, bei denen die Versuchspersonen die Frequenz eines Tones so einstellen mussten, dass er doppelt bzw. halb so hoch klang, wie ein vorgegebener Referenzton. In einem zweiten Experiment mussten die Probanden einen Ton auswählen,der ihrer Empfindung nach genau zwischen zwei Referenztönen liegt. Beide Experimente führten zu ähnlichen Ergebnissen und auf dieser Basis führte STEVENS die mel-Skala ein. Eine Verdoppelung des mel-Wertes führt zu einer Verdoppelung der wahrgenommenen Tonhöhe.
Doch nur im tieffrequenten Bereich wird die Verdoppelung des mel-Wertes von einer Verdoppelung der physikalischen Frequenz begleitet. Im hochfrequenten Bereich muss die Frequenz überproportional steigen um eine Verdoppelung der Tonhöhe zu bewirken. Die folgende Formel gibt einen Zusammenhang zwischen der Tonhöhe μ und der Frequenz f wieder:

μ(f) = 3322*(log(1000+f)-3) ; μ in [mel], f in [Hz]

Um Fehler zu vermeiden, sollte man im Hinterkopf haben, dass ZWICKER eine eigene mel-Skala entwickelt hat, die auf seiner bark-Kurve basiert. Ein "Zwicker-mel" unterscheidet sich also von einen "Stevens-mel".

3. Tonheit (bark-Skala)

Die Tonheitsskala basiert auf Experimenten ZWICKERS, die die Bandbreite der kritischen Bänder oder Frequenzgruppenbreite zu bestimmen versuchten. Die daraus abgeleitete Tonheitsskala soll die menschliche Frequenzwahrnehmung als Reflex auf die Prozesse auf der Basilarmembran widergeben. Diese Frequenzgruppen treten bei der Betrachtung verschiedenster Phänomene auf, so z. B. bei der Bestimmung der Absoluthörschwelle komplexer Laute.
Die Eregebnisse stellen sich wie folgt dar: Ein Bandpassrauschen regt einen auditiven Filter mit der kritischen Frequenz CF = 2kHz an. Solange der Frequenzabstand Δf kleiner ist, als die bandbreite des Filters, werden die gleichen Bereiche der Basilarmembran aktiviert und die Lautheit des verdeckenden Signals bleibt konstant. Überschreitet der Frequenzabstand jedoch die Bandbreite des Filters, werden Nachbarbereiche auf der Basilarmembran aktiviert und die Lautstärke im Bereich der CF sinkt. Der hier befindliche Sinuston muss also nicht mehr die gleiche Schallintensität haben um wahrgenommen zu werden. TERHARDT entwickelte für die Frequenzgruppenbreite BFGfolgende Nährungsformel:

BFG(f) = 86 + 0,0055*f1,4 BFGin [Hz], f in [Hz]

Gemäß dieser Formel bleibt die Frequenzgruppenbreite nicht konstant bei den von ZWICKER postulierten 100Hz, sondern wächst mit steigender Frequenz. Für eine Mittenfrequenz von 10500Hz beträgt die Breite bereits 2500Hz. das zugehörige Band reicht von 9000Hz bis 11500Hz; die Mittenfrequenz liegt also nicht symetrisch.
Durch Aneinanderreihung dieser Gruppen ergibt sich eine Skala (Z), auf der eine Frequentgruppenbreite einen Schritt ausmacht. Diese Schritte nannte ZWICKER bark. Die bark-Skala weist im Bereich von 0Hz bis 16kHz 24 Stufen auf. für den Zusammenhang zwischen Frequenz f und Tonheit Z gibt ZWICKER folgende Formel an:

Z(f) = 13*arctan(0,76*f)+3,4*arctan(f/7,5)² ; Z in [bark], f in [kHz]

4. Äquivalente Rechteckbandbreite (ERB-Skala)

Die ERB-Skala beruht auf einer Bestimmungsmethode der Bandbreite von auditiven Filter. Für die mit Bandsperrrauschen gewonnenen Filterformen kann versucht werden, diese Form so in die von FLETCHER postulierte rechteckige Filterform umzurechnen, dass beide Filter die gleiche Energiemenge weißen Rauschens passieren lassen. Auf diese Weise gewinnt man die "equivalent rectangular bandwith"(ERB). Sie steigt mit der Mittenfrequenz der auditiven Filter an. GLASBERG & MOORE revidierten 1990 ihre Formel für die ERB als Funktion der Frequenz f:

BERB(f) = 24,7*(4,37f+1) ; BERB in [Hz], f in [kHz]

In diese Formel kann jede frequenz eingesetzt werden, denn sie gilt für jeden Pinkt auf der Basilarmembran. Durch Hintereinanderlegen der äquivalenten Rechteckbandbreiten kann eine ERB-Skala erzeugt werden, auf der eine Schrittweite (1ERB) jeweils eine äquivalente Frequenzgruppenbreite ausmacht. Auch die Formel, die die ERB-Zahl/Rate EZ mit der Frequenz f in Verbindung bringt haben GLASBERG & MOORE 1990 revidiert:

EZ(f) = 21,4*log10(4,37f+1) ; EZ in[ERB], f in [kHz]

Diese neue ERB-Skala weist im Frequenzbereich bis 16kHz 40 Stufen aus. Die äquivalente Rechteckbandbreiten und die Methode ihrer Gewinnung ähneln den Frequenzgruppenbreiten. Tatsächlich stimmen ERB- und Bark-Skala für frequenzen über 1kHz fast überein, denn hier entsprechen die äquivalenten Rechteckbandbreiten den Frequenzgruppenbreiten. Unterhalb von 1kHz sind die Frequenzgruppenbreiten breiter als die äquivalenten Rechteckbandbreiten.

Grundsätzlich muss man bei einem Vergleich aller hier erwähnten Skalen der Frequenzempfindung berücksichtigen, dass ihnen allen unterschiedliche Verfahren zugrunde liegen. Die daraus resultierenden Unterschiede können somit nicht Grundlage für eine Bewertung sein. Erst, wenn sie die menschliche Frequenzwahrnehmung darstellen sollen, ist ein Vergleichskriterium gegeben. So bildet z. B. die ERB-Skala die tieffrequenten Bereiche genauer ab als die Bark-Skala.

 

Skalierung der Intensitätsempfindung

Auch hier gibt es mehrere Skalen und Methoden. Die zur physikalischen Größe Intensität gehörende Empfindungsgröße heisst Lautheit und nicht Lautstärke. Diese bezeichnet nämlich schon die Vergleichsempfindung mit einer Referenzintensität (Phon-Skala). In erster Linie hängt die Lautheit von der (physikalischen Größe) Intensität ab, aber auch Frequenz und Dauer besitzen einen Einfluss.

1. Der Intensitätspegel (dB-Skala)

FECHER leitete 1860 die von ihm postulierte logarithmische Beziehung Beziehung nicht auf der Basis von Experimenten ab, sondern aufgrund allgemeiner Beobachtungen. Sein Gesetz in Bezug auf die Beziehung zwischen Lautheitsempfindung L und Intensität I lautet:

L = k*log(I) ; mit k=10

Zum Erzeugen einer Skala muss zusätzlich ein Nullpunkt festgelegt werden. Dieser liegt mit lº = 10 -12 W/m² in der Nähe der Ruhehörschwelle für einen 1kHz Ton. Die dB-Skala ergibt sich nach dieser Ableitung als Funktion des Intensitätspegels P von der Intensität I :

P(I) = 10*(logI+12) ; P in [dB], I on [W/m²]

2. Eben wahrnehmbare Intensitätsänderung

Ähnlich der eben wahrnehmbaren Frequenzänderung gibt es auch eine eben wahrnehmbare Intensitätsänderung ΔI. Das WEBERSCHE Gesetz besagt, dass die eben wahrnehmbare Intensitätsänderung ΔI zwar nicht frequenzunabhängig ist, wohl aber die relative eben wahrnehmbare Intensitätsänderung, d. h. ΔI/I. Die Formel lautet:

ΔI = k*ΔI/I = const.

Zur empirischen Bestimmung der eben wahrnehmbaren Intensitätsänderung kamen sowohl Diskriminationstest als auch Identifikationstests, also Hörtests mit amplitudenmodulierten Signalen, zum Einsatz. Bei der Amplitudenmodulation ändert sich die Amplitude des präsentierten Tones ständig. Die Stärke der gerade wahrnehmbaren Amplitudenänderung ist die gesuchte Größe.
Eine Amplitudenmodulation wird bei 40dB Signalintensität bei ΔI=0,9dB wahrnehmbar, bei 80dB schon bei ΔI=0,3dB. Bei der sukzessiven Präsentation liegen die Werte mit ΔI=1,0dB bzw 0,8dB und ΔI=0,7dB bzw 0,4dB geringfügig höher. In jedem Falle widersprechen die Ergebnisse dem WEBERSCHEN Gesetz, da die Intensität ΔI mit steigender Frequenz immer kleiner wird.

3. Lautheit (Sone-Skala)

Die Sone-Skala basiert entsprechend der Mel-Skala auf dem Verdoppeln und Halbieren der empfundene Lautstärke zweier Vergleichstöne. Ein Ton mit einer Lautheit von 2sone ist also doppelt so laut wie einer mit einer Lautheit von 1sone. Es zeigt sich, dass für Sinustöne mit einem Intensitätspegel von mehr als 40dB eine Verdoppelung der wahrgenommenen Lautheit einer Zunahme des Pegels um fast genau 10dB entspricht. Deshalb wurde international festgelegt, dass ein Sinuston von 1kHz und einem Pegel von 40dB eine Lautheit von 1sone hat. Dabei gilt für lautere Sinustöne von 1kHz die folgende funktionale Beziehung zwischen Lautheit N und Intensitätspegel L:

N(L) = 2 (L-40)/10 N in [sone], L in [dB], L40

Unterhalb von 40dB weist die Lautheitskurve nicht mehr diesen einfachen Zusammenhang auf; mit steigendem Intensitätspegel fällt hier die wahrgenommene Lautheit immer stärker. Mit Hilfe der Lautstärkevergleiche lassen sich die Isophonlinien in Isosonelinien umrechnen und so auf Signale beliebiger Frequenzen anwenden, nicht nur auf Sinustöne von 1kHz.

 

Skalierung der Dauerempfindung

Auch die physikalische Dauer eines Tones löst eine Empfindung aus, die der subjektiven Dauer oder Quantität.
ZWICKER beschrieb 1982, wie auch für die Dauer mit Verhältniswerten eine Skala geschaffen werden kann. Er nennt die betreffende Einheit dura, wobei bei einem 1kHz Ton von 60dB 1dura = 1Sekunde ist. Die Beziehung ist bis hinunter zu einer Dauer von 30ms linear, unterhalb von 30ms nimmt mit einer Kürzung der physikalischen Dauer die subjektiv empfundene Dauer weniger stark ab. Ein 10ms dauernder Ton besitzt die Quantität von 20mdura (Milidura).
Unterschiede in der subjektiven Wahrnehmung treten insbesondere zwischen Dauern von Signalen und den Dauern von Pausen auf. So wird ein 100ms langer Tonimpuls mit einer Frequenz von 3,2kHz als genauso lang andauernd wahrgenommen wie eine 400ms lange Pause.

 

Z U R Ü C K


© 2005 Reinhold Greisbach (Institut für Phonetik)
JWG-Universität Frankfurt am Main

Erstellt von Benjamin Kratz, Janina Schwital, Maren Stahlberg und Kerstin Stock im Rahmen
des Seminars Grundlagen der Phonetik II im SS 04
am Institut für Phonetik der JWG-Universität Frankfurt am Main

COPYRIGHT     IMPRESSUM