Audio informacijos suspaudimas 1/2

frequencies-img

Audio kasetės buvo paskutinis populiarus analoginis garso saugojimo formatas prieš išpopuliarėjant kompaktiniams diskams, kuriuose muzika saugoma jau skaitmeniniame formate.  Šiame įraše apie keletą audio formatų, ir kokių būdu juose informacija yra suspaudžiama.

Pirmoje įrašo dalyje apie tai kaip garso signalas virsta skaitmeniniu,LPCM,FLAC garso formatus.

Garso skaitmenizacija

Skaitmenizuojant analoginį signalą atliekamos du dalykai: diskretizavimas ir kvantavimas.

http://upload.wikimedia.org/wikipedia/commons/thumb/5/50/Signal_Sampling.png/300px-Signal_Sampling.png

Diskretizavimas tai procesas kurio meto tolygus analoginis signalas yra nuskaitomas tam tikru periodu ir taip suformuojamas atskaitos. Iš čia ir atsiranda audio kodekų  8 kHz, 44,1 kHz, 92 kHz. 192 kHz žymėjimai kurie reiškia, jog audio signalas yra diskretizuojamas tarkime 44,1 tūkstantį kartų per sekundę, arba kas apie 23µs. Naikvisto  teorema sako, kad diskretizavimo dažnis turi būti bent du kartus didesnis už analoginio signalo dažnių juostos plotį(arba už maksimalų dažnį.) Nesilaikant šios taisyklės diskretizuojami signalai tiesiog yra iškraipomi. Šia taisykle remiantis garso CD diskretizavimo dažnis yra 44,1 kHz, kas yra maždaug dvigubai kaip žmogaus girdimo dažnio juosta – 20 kHz. Taip pat prieš analogas kodas keitiklį statomas žemo dažnio filtras, kuris praleidžia signalus iki 20 kHz. Žinoma jei bus sugalvota diskretizuoti 8 kHz dažniu filtras turės praleisti tik signalus iki 4 kHz.

 

 http://www.jiscdigitalmedia.ac.uk/images/ITDA-05-bitdepth.jpg

Signalas taip pat kvantuojamas – begalinis signalų amplitudės reikšmių skaičius pakeičiamas baigtiniu. Tolygiai didėjantis ar mažėjantis signalas po kvantavimo keičiasi ne tolygiai, o laipteliais, kadangi galimų amplitudės reikšmių skaičius yra ribotas. Garso CD signalai kvantuojami 16 bitų, kas reiškia, jog yra 2^16 = 65536 galimi signalo lygiai. Ir esant tokiam dideliam atskaitų skaičiui laipteliai vis tiek lieka, sukeldami nepageidaują atsitiktinį triukšmą.

Taigi tolygus analoginis signalas pavirsta tam tikru dažniu išmetamų bitų seka.

Kaip matote perkeliant garsą iš analoginės formos į skaitmeninę jau patiriame nuostolius ir žiūrint iš matematinės pusės skaitmeninis signalas niekad neprilygs analoginiam. Žinoma nereikia galvoti, kad garso kasetės ar plokštelės yra ideali terpė analoginio signalo saugojimui.

LPCM Audio

Tai garso formatas sutinkamas Audio CD, AES3, WAV, AIFF, AU, M2TS, VOB konteineriuose. Jo esmę galima sakyti aprašiau aukščiau. Audio signalas su tam tikru kanalu skaičiumi bitų skaičiumi, bei diskretizavimo dažniu yra skaitmenizuojamas ir viskas, jokios papildomos kompresijos nėra.

FLAC

Tai audiofilų mėgstamas muzikos formatas be kokybės praradimo(lossless). Tiesa, kokybės praradimo čia nėra nuo pradinio skaitmeninio signalo. FLAC galima vadinti audio archyvatoriumi, kadangi su kai kuriais archyvatoriais galima pasiekti panašų suspaudimo laipsnį kaip ir su FLAC. Taigi kaip vyksta suspaudimas:

Audio duomenys yra suskaidomi į blokus, su kuriais atskirai vykdomas apdorojimas. Optimalus bloko dydis 2-6 tūkstančiai atskaitų.

Esant dviem kanalams (stereo) iš jų matematiškai gaunamas centrinis ir šoninis. cent = (K + D) / 2, šoninis= K – D. Taip išlošiama, kadangi panaikinamas informacijos pasikartojimas kanaluose.

image

Toliau atliekama signalo aproksimacija, tai yra signalą bandoma aprašyti formule(polinomu). Kadangi aproksimacija nebūna visiškai tiksli, liekana tarp originalaus signalo ir aproksimacijos išsaugoma. Taip elgiamasi, nes liekanai koduoti reikia mažiau bitų nei originaliam signalui. Į kitą etapą taip pat keliauja ir lygties parametrai.

Liekana yra koduojama specialiu Hufmano kodu variantu. Jis pritaikytas kai mažos kodo reikšmės kartojasi dažniau nei didelės, būtent taip ir yra su liekanom.

Antroje įrašo dalyje bus apie MP3, bei kalbos suspaudimą mobiliuosiuose telefonuose.

Foto šaltiniai [0 1 2], plačiau apie FLAC.

Panašūs įrašai:

  • Tomas

    primena skaitinius metodus ir algoritmus 😀

  • Karvė

    Naudingas ir įdomus įrašas – daug kas buvo girdėta iš nuogirdų, bet čia viskas paprastai ir aiškiai vienoje vietoje. Tokį galima numesti ir apie kompus/algoritmus mažiau nusimanančiam žmogui.

  • Vaidas

    Geras įrašas. Maniau flac visai kitaip veikia.
    Manyčiau reikėtų paminėti, kad analoginis signalas filtruojamas žemadažniu ~20kHz filtru, kad būtų galima diskretizuoti 44kHz dažniu.

    • Tyčia šitą praleidau, bet pridėsiu 🙂

  • auksinsi kardas

    Magnetafonu juostu ir vinilo nenurasyciau kaip atgyvenu. Be pasaliniu triuksmu atsirandanciu atkuriant muzika is siu laikmenu, taip pat atkuriamias visas muzikinis signalas, nes ten nera jokiu diskretizavimu dazniu – signalas eina tolydziai. Teoriskai tai butu tobulas irasas, jei ne triuksmai. Kitas dalykas bent jau man nepatinkantis jog vinilo fonotekai reikia skirti kokia lentyna, kai skaitmenines muzikos didziulius kiekius susirasai i hdd ir patogiai klausai. Nors yra nemazai zmoniu katrie nepaisant siu nepatogumu megaujasi vinilo muzika. Galima didinti diskretizavimo dazni, tuomet signalas labiau tampa panasesnis i realaus pasaulio. http://electronics.howstuffworks.com/question487….

    • Vaidas

      Bet reikia mokėti tą kokybę girdėti. Aš pvz. negirdžiu.

  • zydrius

    as jau nebevertinu tu kompaktu nes reikia jiems dideles prieziuros kad nesusibraiziotu perejau vel prie analoginio iraso turiu astra 209 magnetofona su stiklo feritine galvute garsas is juostos skamba geriau negu is pacio kompjuterio

css.php
Bear