Component - för entusiaster av ljud och bild.

Vad är ljud, egentligen?

Jag kommer att börja dessa artiklar på en mycket övergripande nivå, och även om du tycker att det som skrivs just nu i mångt och mycket kan kännas som en repetition så läs vidare, det kan vara bra att repetera denna information flera gånger. Det är ju ändå detta som är en av grundförutsättningarna för hur vår hobby fungerar.

Det kan dessutom komma att behövas allteftersom det kan bli lite mer avancerat längre fram.

Om man börjar från början - vad är ljud?
Ett ljud är som bekant en vågrörelse, dvs ljud är helt enkelt luft som svänger på olika sätt. Man kan egentligen se dessa svängningar som förtätningar och förtunningar i luften. Dessa förtätningar och förtunningar fortplantas genom en vågrörelse och uppfattas sedan av örat som sedan förmedlar dessa vidare till hjärnan i form av elektriska impulser. Vad vi sedan hör beror på hur många gånger luften svänger per sekund, vilken i sin tur bestämmer ljudets frekvens. Ju färre svängningar per sekund ju längre blir våglängden och ju mer luft måste då svänga.

I HiFi sammanhang brukar man inte tala om svängningar utan använder här begreppet frekvens. Frekvensen mäts i Hertz (Hz) och anger de antal svängningar per sekund som ljudet hinner med.


Bild 1. Lång våglängd ger låg frekvens och vi uppfattar ett basljud.


Bild 2. Kort våglängd ger hög frekvens och vi uppfattar diskantljud.

Alla föremål genererar ljudvågor då de vibrerar. Storleken och formen på det vibrerande föremålet och på sättet det vibrerar på är viktiga faktorer för hur det låter, men även egenskaperna och gränserna hos det medium som ljudvågorna rör sig i (vanligtvis luft!) är lika viktiga när det gäller formen på det utstrålade ljudfältet.

Människans hörsel är dock begränsad, från ca: 15 Hz upp till 20 000 Hz där den övre gränsen sjunker med åldern. Hörseln brukar vara bäst utvecklad vid 20 års åldern, för att sedan sakta sjunka till omkring 16 kHz.

Örats känslighet varierar också mycket vid olika frekvenser. Människan har störst känslighet mellan 3-5 kHz och relativt låg under 500 Hz. Bilden nedan visar grafiskt de ljudnivåer mätt i dB som krävs för att vid olika frekvenser uppnå samma upplevda ljudtryck som en referensnivå vid 1 kHz (1000 Hz). Kurvorna finns under många namn, alla är inte lika men för vanliga dödliga så är dom nog tillräckligt lika, de kan t ex heta Fletcher-Munson (mest kända), ISO-226, Robinson-Dadson, Pollack och så vidare.



För att förstå grafen på bilden så kan man enkelt säga att om en 1 kHz ton spelas i 0 dB så måste en 50 Hz ton spelas i 50 dB för att uppfattas som lika stark - detta innebär en skillnad i ljudtryck på ca: 130 000 ggr. Detta med ljudtryck kommer att förklaras senare i artikeln, så hoppa tillbaka hit då om ni inte förstår just nu.


Tonskillnadströskeln
Örat har vissa begränsningar i hur det kan uppfatta skillnaden mellan två olika frekvenser - detta beskrivs med något som kallas för Tonskillnadströskeln. Den minsta relativa frekvensskillnad (skillnaden mellan två frekvenser uttryckt som f / f ), som ett öra normalt kan uppfatta mellan två toner med samma ljudintensitet, är i mellanregistret ungefär 0,003 (0,3%). Det vill säga att om två toner med en mindre skillnad på frekvensen än 0,3 % spelas samtidigt så kommer man att höra dessa som en enda ton. Detta är alltså vid 1 kHz ca: 3 Hz, vid 4kHz ca 12 Hz och så vidare.

Det är inte bara känsligheten som blir sämre när vi går ned i frekvens, utan det påverkar också tonskillnadströskeln. I det lägre registret behövs alltså en större skillnad i frekvens mellan de båda tonerna för att man skall uppfatta att det är två olika - vid 30 Hz behövs det t ex ca: 1 % - vilket relativt är ungefär detsamma som vid 1 kHz, dvs ca: 3 Hz - men i absolut mening är mycket större eftersom våglängden är så mycket större vid lägre frekvenser. I grafen nedan så kan ni se hur örats känslighet varierar med frekvens.



Hur kan vi då skilja på olika instrument?
Här hamnar vi både i en intressant diskussion hur många kan ur en symfoniorkester plocka ut precis vilka instrument som medverkar genom att bara lyssna? . Kanske detta kan bli en ny artikel längre fram, men jag väljer klokt nog att avstå från det just nu utan säger istället att ljud känns igen främst genom att instrument, röster och så vidare inte endast består av en enda frekvens, utan är uppbyggda av framförallt tre komponenter, nämligen grundtonen, transienten och övertoner. En enskild frekvens kallas för sinuston och kan låta t ex som tut-tonen i en telefonlur - den ligger förövrigt på runt 440 Hz men varierar något över landet.

Av de tre beståndsdelarna i ett ljud kan man enkelt säga att transienten är själva attacken i ljudet (t ex ett slag på en virveltrumma) som kan variera både i styrka och tid. Övertoner är toner som byggs upp runt grundtonen och det finns hos alla ljud (utom sinustoner) och dessa kan också variera i antal och styrka. Det är tack vare övertoner som en ton vid samma frekvens kan låta olika med olika instrument och olika röster. Ljudstyrkan hos de olika övertonerna tillsammans med ljudets attack, längd och avklingingstid ger ljudet dess speciella karaktär.

För att räkna ut vilken frekvens (frekvens har enheten Hz, hertz) som ljudet har så måste man använda lite matematik. Ljudets frekvens f beror av ljudhastigheten v och våglängden l.

Alltså kan vi skriva en formel för frekvensen som ser ut såhär; f = v / l

Eftersom ljudet hastighet i luft är praktiskt konstant, ca 340 m/s (jag vet att om luftens temperatur ökas eller minskas så ändrar sig hastigheten lite, men det är försumbart för våra exempel) så blir det ju ganska lätt att räkna ut ljudets våglängd för människans hörbara område - den varierar alltså från ca 17 meter vid 20 Hz till 17 mm vid 20 kHz.


Vad är Bas och Diskant?
I HiFi sammanhang kan man förenklat säga att frekvenserna fördelar sig enligt följande:
  • Bas 10 - 200 Hz
  • Mellanregister 200 Hz - 5 kHz
  • Diskant 5 kHz - 40 kHz (och högre)
Bastonerna är de lägsta som människan kan registrera men de riktigt låga tonerna kan vi inte höra i vanlig bemärkelse, men vi kan däremot känna dem. Det lägsta som en människa kan höra, i motsats till att känna, är ungefär 15 Hz - om det går lägre än så återstår endast vibrationer. Vi känner naturligtvis frekvenser över 15 Hz också, men då överlappar vi känsloförnimmelsen av bas med att även faktiskt kunna urskilja tonen som sådan, t om vid "normala" lyssningsnivåer.

Fenomenet kallas resonans och uppkommer därför att de låga tonernas svängningar är så pass långsamma att kroppen, klädesplagg eller inredning tvingas att vibrera med - Mer om bas kommer du att kunna läsa om senare i en specialartikel här på Component.

Vi har mest känslig hörsel vid mellanregistret, om du inte tror mig så kolla in de tidigare graferna. Det är även där vi hittar mycket av grundinformationen i musik. Röster, själva "kroppen" i stränginstrument och mycket av definitionen av de flesta instrument (oftast transienter) ligger i det låga mellanregistret från ca: 250 Hz och upp till 3 kHz. Det är här som själva definitionen av instrumenten skapas.

När det gäller diskanten så brukar de flesta veta att det är det som brukar komma ur det lilla högtalarelementet, och vanligtvis brukar man kanske också typiskt tänka på cymbaler etc. - Nu kan ju också vän av ordning fråga sig varför man bryr sig om frekvenser över 20 kHz i diskanten - vi hör ju ändå inte dessa frekvenser, varför skall man spela för förbifladdrande fladdermöss kan man ju undra?

Det finns ett antal anledningar till detta.

För det första så handlar det om linjäritet hos högtalare och förstärkare - betänk följande. Om en högtalare "bara" skulle klara av 20 kHz så kommer toleransen för detta element att medge försämringar och börja rulla av frekvensgången innan 20 kHz punkten är nådd - om du har en frekvensgång upp till t ex 40 kHz så har du med all säkerhet med god marginal bibehållit en bra kurva vid 20 kHz punkten osv.

För det andra så handlar det om övertoner. Det är faktiskt så att när frekvenser inom det hörbara området spelas kommer som alltid ett antal övertoner att skapas som bidrar till den totala ljudbilden. Genom att utöka frekvensgången med ett antal oktaver så kommer man alltså att få en mer korrekt tids och fas respons, även inom det hörbara området. Detta beror på att musik innehåller väldigt mycket information i övertonsregistret, bland annat i transienter, även för mycket låga frekvenser.

Genom att addera möjligheten att spela frekvenser över 20 kHz så kan man uppnå ett avsevärt lyft i den totala ljudbilden utan att faktiskt kunna höra den direkta anledningen till det, utan bara biprodukterna av den - kul va!


Hur mäter man ljud?
Nu blir det lite tyngre, men häng med, det är lättare än det verkar.

Det är också nu som förklaringen till grafen i början kommer.

Ibland brukar man ju säga - vilket grymt tryck det är i ljudet - och det är precis vad det är. När man drar på högre volym så är det som egentligen sker att amplituden (höjden på frekvensen) för en frekvens förändras - amplitud förklaras lättast genom följande bilder.


Bild 5. Låg amplitud ger låg ljudstyrka och vi hör ett svagt ljud, t ex en viskning.

Bild 6. Hög amplitud ger hög ljudstyrka och vi hör ett starkt ljud, t ex ett jetplan.

Amplituden kan i och för sig kunna uttryckas som ett (mikroskopiskt litet) längdmått på miljondels millimeter eller som en avvikelse i mikrobar (miljondels bar) från det rådande lufttrycket. Trots att tryck är vanligtvis mäts i pascal, eller Pa, så brukar just ljudtryck utryckas i decibel, förkortat dB.

dB är ett förhållande mellan ett uppmätt ljudtryck och en referensnivå, där ljudtrycket mäts i SPL, eller Sound Pressure Level. Man har valt detta för att dB utrycks enligt en logaritmisk skala som på ett väldigt bra sätt matchar hur människans hörsel fungerar (hörseln är också i det närmaste logaritmisk).

Formeln för att räkna ut ljudtryck ser ut som följer:

SPL = 20 x log (Pa1 / Pa2)

I formeln står Pa1 för det aktuella trycket i pascal. Att man ska multiplicera med 20 beror på att beteckningen "bel" (B:et i dB) från början var definierat för effekt. Akustisk effekt är proportionell mot kvadraten av trycket och därför har faktorn 20 tagits utanför logaritmen. Pa2 är referenstrycket som brukar vara 2 x 10-5 pascal, vilket är trycket vid hörseltröskeln, 0 dB. Förhållandet mäts alltså mellan 0dB och det aktuella ljudtrycket.

För att beräkna hur många decibel ljudnivån ökar när effekten ändras används följande formel: "Skillnad i SPL = 10 x log (W1 / W2)" där W1 är den nya effekten och W2 är effekten man jämför med. Enkelt kan man säga att om effekten fördubblas ökar ljudtrycket med 3 dB. En tiodubbling av effekten ger en ökning på 10 dB.

Det kan bevisas enligt följande formel:

Skillnad i SPL = 10 x log (2W1 / 1W2) = 10 x log (2) = 3.01 dB

På ett enklare sätt kan man säga att om ljudstyrkan fördubblas ökar bara decibeltalet med 3 dB - enligt samma modell ger en ökning med 10 dB en ökning på 10 gånger ljudstyrkan och en ökning med 20 dB gör att ljudstyrkan ökar med hela 100 gånger.

För att ytterligare förklara så kan man ta ett annat scenario där du har två stycken bilar som vardera ger ifrån sig 70 dB i ljudnivå - detta resulterar INTE i ett ljudtryck på 140 dB (tack och lov, det skulle ha motsvarat ett Jetflygplan) utan endast i 73 dB - det vill säga en fördubbling i ljudstyrka.


Hur reagerar örat vid korta ljud då?
Transienter är en mycket kort attack eller en puls av ljud. Transienter finns överallt och motiverar några ord om örats reaktion på just kortlivade ljud.

En 1 kHz ton låter bara som en 1 kHz ton vid en varaktighet på tider upp emot en sekund, men om man spelar samma ton under en mycket kort tid, dvs en extremt kort transient, så kommer det bara att låta som ett klick. Det förklarar på ett enkelt sätt hur tiden som ett ljud är aktivt kommer att påverka den upplevda ljudstyrkan - Korta transienter vid en frekvens kommer alltså att låta som de är lägre i nivå än långa ljud av samma frekvens.

Grafen nedan visar hur mycket nivån på en transient måste höjas för att upplevas med samma ljudstyrka som en längre puls eller ihållande ton.



För att förtydliga bilden något så behöver alltså en 10 millisekunders puls en ca: 10 dB högre nivå för att upplevas lika starkt som en 100 millisekunders puls.

När man närmar sig 100 ms regionen ändrar sig läget, och över den pulstiden är det inte längre någon skillnad mellan längre och kortare pulser. 100 ms visar sig vara örats tidskonstant eller integrationstid. Vad man egentligen kan dra för slutsats är att öronen helt enkelt är mindre känsliga för korta transienter.


Hur mycket motsvarar då x dB?
Sverige är exemplariskt när det gäller att klargöra vad som gäller i arbetsmiljön, och därför har jag hittat lite fina exempel på vad som kan vara skadligt och inte.
  • Gränsvärdet för vad öronen klarar utan att skadas är i Sverige satt till 85 dB åtta timmar om dagen under varje arbetsdag.
  • Om ljudvolymen ökar med 3 dB till 88 dB så halveras tiden och man når gränsvärdet efter fyra timmar. Detta eftersom tre dB innebär att ljudstyrkan fördubblas och således tiden halveras.
  • Om volymen ökar ytterligare 3 dB till 91 dB bör man inte exponera sig mer än två timmar.
Det är också högst individuellt hur stor belastning hörseln tål. En del har "glasöron" andra har "stenöron". Problemet är väl att man aldrig kan veta om man har glasöron förrän det är för sent. Det är också nu som pappaförmaningen kommer - Tänk på att en skadad hörsel ALDRIG kan repareras.

För att kunna relatera till hur mycket olika dB nivåer motsvarar så har jag samlat ihop lite olika grovt förenklade exempel på vanliga ljudstyrkor att relatera till:

  • 0 dB Det svagaste ljud ett friskt öra kan uppfatta.
  • 10 dB Vindens sus
  • 20 dB Viskning
  • 30 dB En modern videoprojektor
  • 40 dB Bakgrundssorl, radio på låg volym
  • 50 dB Lågmält samtal
  • 60 dB Normal samtalston
  • 70 dB Normal tvättmaskin
  • 75 dB Referensnivå för kalibrering av hembio högtalare enligt THX
  • 80 dB Café, affär
  • 85 dB Den rekommenderade ljudvolymen där du kan vistas i under åtta timmar om dagen utan att ta skada. Nivåer över detta börjar att bli "farliga".
  • 90 dB Högt skrik
  • 100 dB Bra drag på stereon, grannarna knackar nog snart på!
  • 110 dB Nattklubb, hårdrocksbaren på Sturecompagniet!
  • 120 dB Rockkonsert, jetplan startar på ca 100m avstånd Varning - kan ge hörselskador!
  • 125 dB Den s.k. smärtgränsen. Det är när man börjar känna obehag inne i örat. Men tänk på att långt innan dess är ljudvolymen farlig.
  • 140 dB Jetflygplan, grava hörselskador!
  • 150 dB Gevärskott, ljudet är så kort att örat uppfattar inte det som farligt. Men örat tar fortfarande skada!
  • 180 dB Kraftig explosion, Kanonskott, trumhinnorna spricker!
  • Drygt 190 dB Den högsta nivå som ljud kan ha i luft

Jag hoppas att denna lilla mjukstart skall ha fräschat upp era kunskaper inom ljud, och att ni följer de kommande artiklarna där jag kommer att skriva mer om t ex bas och hur det fungerar, kritisk lyssning och lite guider med tips och råd om hur ni kan välja högtalare, subbasar, dvd spelare osv.

Var rädd om öronen - och kom ihåg, det du tycker låter bra är bra för dig.


Skriven av:
Pär Hörnell

Publicerad: 2003-05-23
Uppdaterad: 2007-04-24