Audio informacijos suspaudimas 1/2

frequencies-img

Audio kasetės buvo paskutinis populiarus analoginis garso saugojimo formatas prieš išpopuliarėjant kompaktiniams diskams, kuriuose muzika saugoma jau skaitmeniniame formate.  Šiame įraše apie keletą audio formatų, ir kokių būdu juose informacija yra suspaudžiama.

Pirmoje įrašo dalyje apie tai kaip garso signalas virsta skaitmeniniu,LPCM,FLAC garso formatus.

Garso skaitmenizacija

Skaitmenizuojant analoginį signalą atliekamos du dalykai: diskretizavimas ir kvantavimas.

http://upload.wikimedia.org/wikipedia/commons/thumb/5/50/Signal_Sampling.png/300px-Signal_Sampling.png

Diskretizavimas tai procesas kurio meto tolygus analoginis signalas yra nuskaitomas tam tikru periodu ir taip suformuojamas atskaitos. Iš čia ir atsiranda audio kodekų  8 kHz, 44,1 kHz, 92 kHz. 192 kHz žymėjimai kurie reiškia, jog audio signalas yra diskretizuojamas tarkime 44,1 tūkstantį kartų per sekundę, arba kas apie 23µs. Naikvisto  teorema sako, kad diskretizavimo dažnis turi būti bent du kartus didesnis už analoginio signalo dažnių juostos plotį(arba už maksimalų dažnį.) Nesilaikant šios taisyklės diskretizuojami signalai tiesiog yra iškraipomi. Šia taisykle remiantis garso CD diskretizavimo dažnis yra 44,1 kHz, kas yra maždaug dvigubai kaip žmogaus girdimo dažnio juosta – 20 kHz. Taip pat prieš analogas kodas keitiklį statomas žemo dažnio filtras, kuris praleidžia signalus iki 20 kHz. Žinoma jei bus sugalvota diskretizuoti 8 kHz dažniu filtras turės praleisti tik signalus iki 4 kHz.

 

 http://www.jiscdigitalmedia.ac.uk/images/ITDA-05-bitdepth.jpg

Signalas taip pat kvantuojamas – begalinis signalų amplitudės reikšmių skaičius pakeičiamas baigtiniu. Tolygiai didėjantis ar mažėjantis signalas po kvantavimo keičiasi ne tolygiai, o laipteliais, kadangi galimų amplitudės reikšmių skaičius yra ribotas. Garso CD signalai kvantuojami 16 bitų, kas reiškia, jog yra 2^16 = 65536 galimi signalo lygiai. Ir esant tokiam dideliam atskaitų skaičiui laipteliai vis tiek lieka, sukeldami nepageidaują atsitiktinį triukšmą.

Taigi tolygus analoginis signalas pavirsta tam tikru dažniu išmetamų bitų seka.

Kaip matote perkeliant garsą iš analoginės formos į skaitmeninę jau patiriame nuostolius ir žiūrint iš matematinės pusės skaitmeninis signalas niekad neprilygs analoginiam. Žinoma nereikia galvoti, kad garso kasetės ar plokštelės yra ideali terpė analoginio signalo saugojimui.

LPCM Audio

Tai garso formatas sutinkamas Audio CD, AES3, WAV, AIFF, AU, M2TS, VOB konteineriuose. Jo esmę galima sakyti aprašiau aukščiau. Audio signalas su tam tikru kanalu skaičiumi bitų skaičiumi, bei diskretizavimo dažniu yra skaitmenizuojamas ir viskas, jokios papildomos kompresijos nėra.

FLAC

Tai audiofilų mėgstamas muzikos formatas be kokybės praradimo(lossless). Tiesa, kokybės praradimo čia nėra nuo pradinio skaitmeninio signalo. FLAC galima vadinti audio archyvatoriumi, kadangi su kai kuriais archyvatoriais galima pasiekti panašų suspaudimo laipsnį kaip ir su FLAC. Taigi kaip vyksta suspaudimas:

Audio duomenys yra suskaidomi į blokus, su kuriais atskirai vykdomas apdorojimas. Optimalus bloko dydis 2-6 tūkstančiai atskaitų.

Esant dviem kanalams (stereo) iš jų matematiškai gaunamas centrinis ir šoninis. cent = (K + D) / 2, šoninis= K – D. Taip išlošiama, kadangi panaikinamas informacijos pasikartojimas kanaluose.

image

Toliau atliekama signalo aproksimacija, tai yra signalą bandoma aprašyti formule(polinomu). Kadangi aproksimacija nebūna visiškai tiksli, liekana tarp originalaus signalo ir aproksimacijos išsaugoma. Taip elgiamasi, nes liekanai koduoti reikia mažiau bitų nei originaliam signalui. Į kitą etapą taip pat keliauja ir lygties parametrai.

Liekana yra koduojama specialiu Hufmano kodu variantu. Jis pritaikytas kai mažos kodo reikšmės kartojasi dažniau nei didelės, būtent taip ir yra su liekanom.

Antroje įrašo dalyje bus apie MP3, bei kalbos suspaudimą mobiliuosiuose telefonuose.

Foto šaltiniai [0 1 2], plačiau apie FLAC.

Panašūs įrašai:

css.php
Bear