Component - för entusiaster av ljud och bild.

Lite tankar om digitala signaler och jitter!

Många diskussioner om digitalt ljud och digitala överföringar slutar (eller börjar) med att - det är digitalt och därför är det likadant - annars skulle ljudet/bilden hacka eller det skulle bli svart eller tyst! Om det ändå vore så enkelt.

En av de vanligaste missuppfattningar som man faktiskt stöter på är att den digitala signalen är oförstörbar. Detta är faktiskt helt fel! En digital signal är minst lika känslig som en analog signal men den är känslig för andra saker. En av de saker som många inte förstår är jitter, men mer om det senare i artikeln.

För att börja någonstans så kommer först en kort beskrivning om vad digitalt ljud är. Vi har för enkelhets skull förenklat beskrivningen av tekniken, så allt är inte teknisk exakt korrekt, men vi tror att det är principen som är mer intressant än den absoluta teorin i detta fall.

Från analogt till digitalt

En analog ljudvåg illustrerad som elektrisk våg

Som bekant är ljud en vågrörelse, dvs helt enkelt luft som svänger på olika sätt. Detta kan avbildas till en vågrörelse som kan ses som en analoga elektriska signaler i t ex ett oscilloskåp. Du kan läsa mer om ljud i artikeln Vad är ljud, egentligen?.

För att omvandla dessa signaler till digitala koder behövs en analog till digital omvandlare (ofta förkortad till A/D-omvandlare). Sådana sitter i t ex ljudkort på datorer, och i digital inspelningsutrustning. I en A/D-omvandlare sker även samplingen av ljudet.

Vad är då sampling?

Om bilden visar vågen under en millisekund blir samplingsfrekvensen 10kHz med 10 samplingar.

För att digitalisera ljud måste man sampla. Sampling innebär att man ett visst antal gånger per sekund "mäter" den nivån på ljudvågen. Ju tätare mätningar eller samplingar, desto mer exakt ljud, men också mer data att överföra och fler beräkningar att utföra. Samplingsfrekvensen är alltså baserad på antalet sampel som skall ske under 1 sekund.

Enligt "Nyquists teorem" måste samplingsfrekvensen vara dubbelt så hög som den högsta frekvens du vill återge. Man brukar säga att en människas hörsel normalt begränsas vid vid 20 kHz, vilket gör att man då skulle behöva 40kHz som samplingsfrekvens. En CD-skiva använder sig av 44.1kHz som samplingsfrekvens och räcker alltså till för detta.

Kvantisering

Den kvantiserade analoga signalen

Efter samplingen måste varje mätvärde avrundas till närmaste digitala nivå - detta kallas för kvantisering. Ju fler nivåer desto större precision och därmed bättre ljud (mindre kvantiseringsfel), men som förut, mer data att överföra och fler beräkningar att göra.

I bilden du ser motsvaras varje sampling av 14 bitar (sträcken på y-axeln). För en CD-skiva använder man normalt sexton bitar per sampling. 16 bitar innebär att en sampling kan ha ett värde mellan 0 - 65 535. Man räknar fram detta genom att ta 2 upphöjt till antalet bitar. 2 upphöjt till 16 är 65 536 dynamiska steg.


Den slutgiltiga digitaliserade analoga signalen jämförd mot den ursprungliga signalen
Detta kan ses som ett mått på hur nära den riktiga ljudvågen vi hamnar. Ökar vi upplösningen till 24 bitar per sampling (som för t ex DVD-A) får vi istället 16 777 216 dynamiska steg (2 upphöjt till 24). Alltså över 16 miljoner möjliga värden att beskriva ljudet med. Detta innebär också att ljudet beskrivs 256 gånger mer exakt med 24-bitars upplösning än med 16-bitars upplösning - och visst hörs det!

Vad tusan är jitter egentligen?
I "svensk standard" definieras jitter som: "liten variation i pulsläge, pulslängd eller pulsavstånd [...] jitter är oftast icke önskat och uppträder slumpvist eller regelbundet beroende på ursprung".

För den applikation som vi tittar på just nu, dvs överföring av en digital dataström för ljud och bild så kan man enkelt sagt likna det vid störningar eller ojämnheter i tidsdomänen på digitalströmmen, ofta orsakat av nogrannheten på den klocka som styr överföringen. Det är detta som kan påverka kvalitén i överföringen av en digital dataström.

Man kan förenklat kalla motsvarigheten i analoga överföringar för svaj. Jittret kan göra att D/A-omvandlaren placerar värdena lite fel i tiden, och det kan förändra signalen så att man får en lite mindre ren återgivning. Men fenomenet är svårt att mäta, och det är svårt att veta vad som egentligen påverkar ljudet. I de flesta diskussioner så talar man hela tiden om "antalet" data bitar, men det som spelar roll är om strömmen "svajar" eller inte och tvivlar inte på att majoriteten bitar kommer fram. Men det är precisionen på när de kommer fram som är det viktiga. Vid kopiering av data så är det ju bara mängden data som jämförs, men vid uppspelning är det ordningen på datat som är det viktiga.


En jämn analog signal som samplas och kvantiseras.

Jitter kan uppstå på olika sätt och är som vi tidigare konstaterat definitivt hörbart när man lyssnar på informationen. Det som folk ofta "glömmer" är att det inte är ointressant när bitarna kommer fram, detta eftersom det inte är statiskt data vi lyssnar på. Vi skulle också vilja påstå att det är det som gör den stora skillnaden i hur "musikaliskt" man upplever det som spelas upp. När man alltså skall lyssna på ettor och nollor så är det absolut nödvändigt att dom kommer i exakt rätt tid - dvs utan jitter.

Det kan på ett enkelt sätt illustreras med en jämn analog signal som samplas och kvantiseras.


Vissa sampel blir fördröjda och bitarna blir istället kommer istället att representeras av den blå signalen.

När nu avspelning av denna signal sker så blir den störd och därmed jittrig vilket medför att vissa sampel blir fördröjda och bitarna blir istället kommer istället att representeras av den blå signalen.

Om jittret blir för extremt så kan till och med bitfel uppstå. Ett bitfel uppstår när den apparat eller komponent som skickar eller tar emot en signal inte kan avgöra om det är en etta eller nolla. Detta för att det inte finns en "riktigt" digital signal, dvs en serie som t ex 00100101001 överförs över kablarna i signalväg som en variabel spänning som spendar mesta tiden i ena eller andra änden av en skala. För enkelhets skull kan vi säga att en 0:a representeras av 0 volt och en etta av 1 volt (förenklat nu OK!).

När uppstår då jitter egentligen?
Som vi såg i bilderna tidigare så kan alltså signalen förändras på ett avsevärt sätt, men hur uppstår egentligen förändringen?

Vi kommer att i detta exempel förutsätta en spelare (DVD eller CD spelar ingen roll) som är helt jitterfri - detta innebär att när den skall skicka 1 volt så gör den det.

Eftersom inte spänning kan stiga i en rak våg så finns det en inbyggd tröghet i hur spänningen stiger och sjunker - oftast är dessa två olika. Oturligt nog så är inte de system som de flesta av oss har hemma lika bra som teorin utan drabbas av sådant som jitter, där förändringen mellan 0 och 1 sker över tid.

Det finns rätt många sätt som jitter kan påverka D/A-omvandligen till en DAC - jitter på den utsända signalen kan förändras med avseende på överhörda signaler, med spänningsförändringar etc. etc.

Det problem som kan uppstå i t ex en kabel är när signalen når mottagarändan så har spänningen minskat i amplitud (0 volt kanske fortfarande är 0 volt men 1 volt kanske har minskat till 0.7 volt) dessutom är det möjligt att signalen kan ha plockat upp lite andra högfrekventa störningar på vägen. Totalt innebär detta att signalen kommer att se mycket annorlunda ut på mottagarsidan än på spelarens sändarsida.

När det gäller ettor och nollor så kan vi kliva tillbaka till exemplet med 0 och 1 volt. För att kunna avgöra om det är en etta eller nolla så måste vi sätta en referensnivå när det är det ena eller det andra. Eftersom vi vet att signalen kommer att kunna minska så är det logiskt att sätta den vid t ex 0.5 volt. Ifall nu spänningen ligger mycket nära denna nivå för både 0 volt och 1 volt tillsammans med dålig stig och sjunktid, uppstår problem. Om man desutom adderar andra störningar så blir slutresultet ännu värre.

Som exempel så tänk på beskrivningen jag gav förut om förflyttningen från 0 till 1 volt. Låt oss nu säga att denna tog 500 ns (nanosekunder). Vi hamnade alltså på 0.7 volt efter denna tid eftersom någon form av förlust inträffade - t ex i en kabel eller för att det fanns oregelbundenhet i strömförsörjningen.

I en perfekt värld så skulle alltså mottagarsidan dektektera att spänningen blev 1 efter 500 ns - men det sker ju inte eftersom spänningen stiger gradvis och inte i 1 voltssteg. Så i realiteten är spänningen över 0.5 voltsgränsen (som var mitt emellan 0 och 1) efter kanske 502 ns från det att spelaren skickade ut 1.

Låt oss nu addera lite störningar till bilden - t ex en +200mV spik som träffar precis när den ökande spänningen kommer fram till mottagaren. Detta får spänningen att öka snabbare än vad signalen lämnade spelaren och säg att nu detekteras 1:an efter 498 ns. På samma sätt om en negativ spänning (-200mV) träffar signalen så kommer en fördröjning att inträffa - så nu detekteras 1:an vid 505 ns.

Datat kommer fortfarande att vara mottaget till 100%, men tiden som dessa tas emot kommer att vara påverkad av dessa problem. Om jittret blir för markant så kommer det att orsaka ett ofokuserat ljud med dåligt stereoperspektiv ljudet kan även komma att låta lite vassare, torrare och mindre detaljerat, detta beroende på att ljudet kommer att levereras med oregelbundna intervall till högtalarna

Vad är skillnaden på jitter mellan CD-ljud och Bioljud?
CD-skivor är generellt kodade med Puls Code Modulation (PCM), men Dolby Digital (DD) och Digital Theater Systems (DTS) använder sig av egenutvecklade protokoll, vilka använder sig av Cyclic Redundancy Check (CRC) för att minimera bitfel. Här brukar oftast nämnas att de skillnader som finns i kodningen av PCM och DD eller DTS strömmar, med hänsyn till att DD och DTS har CRC kontroll, skulle göra DD och DTS okänsliga för jitter.

Tyvärr är det ingen skillnad på dessa olika strömmar eftersom allting som går över S/P.DIF (både koax och optisk) använder sig av PCM som transportprotokoll. Det är också så att, förutsatt att inte rate-converting eller uppsampling inträffar, en surroundprocessor alltid måste leverera ett ut-sample för varje in-sample annars så kommer det att ske drop-outs i bitströmmen (dessa låter som popps eller hack!). När man uppsamplar så måste exakt två samples levereras per in-sample. Om detta fördröjs så kommer på samma sätt dataströmmen att svaja för DD och DTS som den gör för PCM.

Problemet och skillnaden mellan olika DVD/CD-spelare är enligt oss fortfarande på det jitter som levereras över digitalutgången till en processor (som i regel alltid är utrustad med en FIFO buffer) som sedan träffar "klockan" som skall synkronisera ljudet ur S/P-DIF dataströmmen.

Om man nu använder en FIFO så kommer en viss del av jittret fortfarande att finnas kvar - om du seriekopplar tre stycken (som t ex Meridian gör) så kommer fortfarande mätbart jitter att finnas kvar - även om det är på picosekundnivå. Faktum är att om man kopplar 100 st FIFO efter varandra så kommer fortfarande det att finnas mätbart jitter - däremot kan man fråga sig nyttan med det. Om jittret ligger på nanosekund nivå så är det hörbart för mig, men blir ohörbart när det ligger på picosekundnivå, men det finns förmodligen "guldöron" som kan höra det även där, vad vet vi?

En av våra husgurus, John Atkinson, nämner t ex i artikeln "Jitter, Bits, & Sound Quality", http://stereophile.com/reference/1290jitter/ " Nevertheless, these results tie in with work by others that indicates that 16-bit data jitter of any kind needs to be less than 200ps or so if it is not to produce measurable effects in the analog signal (footnote 5), which in turn means that even though the data are reclocked, the crystal clock in the CD player or the PLL in the processor that do that reclocking need to hold their word-to-word timing accuracy to better than 10 parts in a million. And that time precision needs to be preserved during the digital data's travails on its way to the DAC, something that in my opinion is, frankly, unlikely."

Vid kopiering av data är detta däremot av mindre betydelse, precis som nämts tidigare. Detta eftersom man vid hantering av datafiler inte är beroende av tidsfel på samma vis, utan endast tittar på datamängder. Rätt hanterad är en digital signal ganska oöm men det är mycket i en olika källor som gör att signalen påverkas på olika sätt. Det är främst detta som skiljer en dyr spelare från en billig - dvs det faktum att man har tagit hänsyn till många av dessa problem.

Hur uppstår jitter då?
I de applikationer som vi är intresserade av, t ex CD/DVD-spelare så är det vanligt att jitter uppkommer beroende av överhörning mellan olika digitala kretsarna via spänningsmatning eller jordplan. Detta ger sig tillkänna i distorsion.

Många anser av detta skäl att det är viktigt att felkorrigeringskretsarna arbetar så lite som möjligt för att inte i onödan smutsa ner spänningsmatningen. Överhörning kan också ske via luftburen information av typen radiosignaler. Även den digitala utgången måste ha en tillräckligt stor bandbredd och en exakt utgångsimpedans annars uppstår ofelbart påverkan på signalen - en påverkan i form av jitter som definitivt är hörbar! Dessa problem är ingalunda något fenomen som endast är uppmärksammat av "guldöron" utan är även klart erkänt av olika tekniker.

Alla dessa problem är alltså sådana som påverkar i den digitala domänen, men även vid omvandling från digitalt till analogt sker en påverkan av ljudet. I Digital till analogomvandlaren, i dagligt tal kallad D/A omvandlaren sker omvandlingen från 1:or och 0:or till en analog signal. Detta kan också göras på olika sätt och med olika precision. Här räcker det med att konstatera att konstruktionen av omvandlaren och spänningsmatningens renhet ger stora och mätbara skillnader i distorsion i form av jitter.

Vi hoppas att detta har bringat lite klarhet, väckt nya tankar och kanske resulterar i debatt?

För de som är ytterligare intresserade av jitter, dess orsak och verkan kan vi rekommendera följande artiklar:

http://stereophile.com/reference/1290jitter/
http://www.vectron.com/products/appnotes/jitter.htm
http://www.dcsltd.co.uk/technical_papers/jitter.pdf


Skriven av:
Pär Hörnell

Publicerad: 2005-03-21
Uppdaterad: 2007-04-24