Metode de compresie a datelor multimedia

În plus, vom detalia principiile de bază care stau la baza algoritmilor de compresie a datelor multimedia, care pot micșora la dimensiunea din trecut, pentru transmisii reale pe Internet.

Clasificarea tipurilor de compresie a datelor

Pentru a începe, să definească gradul de compresie pentru a continua pentru a selecta cele mai potrivite pentru transmiterea de informații prin intermediul Web-ului. Vom efectua o clasificare a tipurilor de compresie pe gradul de pierdere a calității.

1. compresie fără pierderi

2. compresie Lossy

2.1. compresie fără pierderi este perceptiv

2.2. Comprimare cu lossy naturale

Cu alte cuvinte, în acest caz, o degradare naturală așa-numita a imaginii la care a pierdut unele mici părți ale scenei. Meciurile pot să apară, de asemenea, in vivo, cum ar fi în ploaie sau ceață. Imaginea în aceste condiții este, în general distinge, cu toate acestea, detaliile acesteia scade.

2.3. Compresia cu pierderea nenaturala de calitate

Calitate scăzută de compresie, denaturează foarte mult imaginea și aplică artificial în acestea (nu există în original) detaliile scenei, numite de compresie lossy nenatural. Un exemplu este un „blockiness“ într-un format MPEG extrem de comprimat, de exemplu, în alte compresoare folosind tehnologia BDKP.

Unnaturalness este în primul rând încalcă cele mai importante din punct de vedere al percepției umane a caracteristicilor imaginii - circuite. Experiența arată că acest circuit permite unei persoane pentru a identifica în mod corect un obiect vizual special.

Comprimarea datelor multimedia pentru prezentarea pe Web

Deci, haideți să aruncăm o privire mai atentă la principiile care stau la baza fiecăruia dintre acești algoritmi și metode de compresie a datelor multimedia.

MPEG-4. Ce este?

Principiile de funcționare a algoritmului de compresie MPEG-4

Cu toate acestea, MPEG-4, cu excepția considerat convențional MPEG-codare, bazate pe cadre dreptunghiulare utilizează tehnologia de așa-numita codare imagine fractală sau bazată pe contur.

Baze de codificare de imagine fractală

Pentru a înțelege principiile bazate pe contur de codificare de imagine, se aplică la MPEG-4, înțelegeți-vă câteva idei simple.

Contur - o linie de a delimita cifrele limite în privința planului. Reprezentarea imagine a suprafeței structurii - textura. codare bazată pe contur de imagini este o imagine ca o schiță, o regiune plicuri textura (regiune texturi pline). Și, din moment ce contururile coincid sunt, în general, cu limitele de obiecte dintr-o scenă descrisă, problema de codare bazate pe contur se reduce la problema de codare bazate pe obiect de imagini, și anume o imagine reprezentată de un set de obiecte sale constitutive.

Inutil să spun, problema de codare bazate pe contur este in prezent una dintre cele mai promițătoare și, probabil, unul dintre foarte intensiv forța de muncă (în termeni de calcul).

obiecte individuale

Ce este DivX?

Aceasta este, de fapt, acest algoritm nu este acceptat în mod oficial, cel puțin în această versiune, cu toate acestea, DivX este bazat pe formatul MPEG-4.

DivX frumusete a algoritmului este că filmul de durată de până la trei ore, poate fi comprimat într-o formă de volum de pe un CD, care este de două ori mai mică decât cea a MPEG-1, iar rezultatul va fi o calitate mai bună a imaginii, în special în ceea ce privește rezoluția. A apărut pe discurile de pe piață care conțin filme în standardul MPEG-4 - cazul unei astfel de utilizări algoritmul DivX. Valoarea lor variază acum de la 50 la 100 de ruble, în funcție de calitatea și conținutul. Sursa este folosită de obicei, DVD-uri. Cele mai multe dintre filmele înregistrate în format 16: 9, nu oferă o imagine mai bună pe monitor, dar calitatea acestor filme, tind să fie mai mare decât filmele cu obișnuitul format 4: 3. În plus, cea mai mică lungimea filmului, cu atât mai mare rata de biți poate fi utilizat pentru a umple întregul spațiu al CD-ului. Desigur, în acest caz, calitatea este mai mare.

Să presupunem că unele moduri misterioase primit DVD-disc cu un film bun. Datorită tehnologiei DivX, puteți salva fișierul de film de la, să zicem, pe hard disk, și chiar și o stoarce decentă l în volum, deși cu unele pierderi de calitate. Ulterior, fișierul comprimat rezultat poate fi ars pe CD-R, precum și orice alt fișier și utilizați-l la momentul potrivit.

Dacă nu aveți dorința sau capacitatea de a se angaja în auto-compresie, este posibil să se utilizeze produse finite, volumul care este în creștere rapidă.

Despre MPEG Layer 3, nu numai

Pentru codificare eficientă a datelor audio în cele mai avansate Web aplică metode care se bazează pe proprietatea versatilitatea și independența lor față de calitatea pistei de sunet original, precum și ca rezultat, în funcție de setările folosite în timpul compresiei.

În prezent, cel mai cunoscut audio MPEG, Pasc și ATRAC. Ei folosesc toate așa-numita codarea perceptuală pentru (codificare perceptivă), în care semnalul sonor este îndepărtat din informația, discret la ureche. Ca urmare, în ciuda schimbării în formă și spectrul de semnal, percepția ei auditive rămâne practic neschimbată, iar rata de compresie justifică o ușoară scădere a calității. Această codificare se referă la metoda de comprimare cu pierderi, atunci când din semnalul comprimat este deja imposibil de a restabili cu exactitate forma de undă originală.

Metodele de îndepărtare a unei porțiuni a informației în baza particularităților auzului uman numit mascare: prezența unei componente de frecvență mai slabe în vecinătatea lor greu percepută de urechea la sunetul pronunțat vârfuri (armonica predominant) spectrul (mascat). Când codificarea fluxului audio întreg este împărțit în cadre mai mici, fiecare dintre acestea fiind convertite într-o reprezentare spectrală și este împărțit într-un număr de benzi de frecvență. In cadrul benzilor este detectarea și înlăturarea mascarea sunetelor, atunci fiecare cadru este codat direct în forma spectrală adaptive. Toate aceste operații pot în mod semnificativ (de mai multe ori) pentru a reduce cantitatea de date menținând în același timp calitatea care este acceptabil pentru cei mai mulți ascultători.

Fiecare dintre metodele de codificare descrise se caracterizează prin rata de biți, la care informațiile comprimat trebuie să ajungă la decodor în reconstruirea unui semnal audio.

Decodorul convertește serie comprimat de spectre de semnal instantaneu într-o formă de undă digitală convențională.

Audio MPEG - tehnici de compresie audio de grup standardizate MPEG (Moving Pictures Experts Group - grupul de experți pentru procesarea imaginilor în mișcare).

Informațiile din MPEG-fișierul înregistrat blocuri succesive de - cadre (cadre), care sunt citite secvențial, și apoi decodate. În mod firesc, cu atât mai mare debitul, cu atât mai mare cantitatea de informații este în dosar și, în consecință, cu atât mai mare reprezentarea sunetului original conține.

Audioinfopmatsiya, comprimat prin acest sistem poate pepedavatsya flux (streaming), și pot fi stocate într-un format MP3 fișier sau WAV-MP3. Diferența față de prima secundă este prezența unui antet fișier WAV suplimentar, care permite prezența sistemului MP3-codec pentru a lucra cu un astfel de fișier folosind instrumente standard de Windows.

Ideea de bază se bazează pe excentricitate toate tehnicile de compresie aydiosignala cu potepi - refuzul kodipovaniya detalii fine zvychaniya opiginala situată în afara între limitele posibilităților umane slyha. Sunete care sunt la granițele diferenței de nivel abrupt: dupa un sunet foarte puternic în intervalul de timp scurt de aproximativ 100 ms, iar în fața ei, timp de 5 ms, urechea umană nu este capabil de a percepe alte sunete, mai silențioase.

Vorbind despre care, de obicei au în vedere posibilitatea de a conștientizării conștiente, ignorând efectul frecvent al percepției subliminale de o varietate de piese mici, relativ liniștite; folosindu-le, de exemplu, sunt adesea furnizate compoziții de colorare emoțională. Dar, dacă în timpul kodipovanii încă ogpanichivatsya doar pierdere într-adevăr imperceptibil, puteți govopit sohpanenii privind calitatea inițială a aydio codată.

După cum se știe, cel mai important rol vârfurilor de transmisie a semnalului audio ale anvelopei, în timp ce tranzițiile aproape de zero poate fi sacrificată (vezi. Fig. 1).

După acest tratament sunetul probă ușor comprimat folosind algoritmi de codificare convenționale LZ sau Huffman.

Esența de codificare în conformitate cu tehnica stereo comun este doar TRANSFORMĂRI stepeosignala în semnalul mediu între canalele și diferența dintre ele. Dar aceasta este doar una din variantele stereo comun, numit MS stereo. La debite foarte scăzute, cum ar fi 96 kbit / s, se aplică MS / IS tehnica stereo în care pentru anumite benzi de frecvență, în loc de diferența dintre canalele memorate doar informații despre un raport de putere a semnalului în diferite canale. FhG IIS codifică astfel de produse numai frecvențele înalte, dar unele codificatoare vă permit să selectați manual intervalul dorit. Din păcate, alegerea este de a specifica valoarea dorită a uneia dintre variabilele interne format neconvingătoare, nu este explicat în documentație.

Final vepsii vysheypominaemoy modelul psychoacoustic nu există, și nici nu există un algoritm la un kodipovaniya standaptnogo definit. În acest sens, în volumul oschytimosti general, slychae și gradul de pierderi care este determinată de un stopony, curgerea și cu dpygoy - caracteristici konkpetnoy modelul psihoakysticheskoy Scaun Tip utilizat în fiecare coder konkpetnoy. Ultimul punct este deosebit de important la debite mici. Acolo nabop efectele pe care aceste fluxuri pentru a răspunde cu greu kodipovaniyu.

Și o altă caracteristică a urechii umane a fost luată în considerare în dezvoltarea unui algoritm de compresie - utilizarea unui prag minim de audibilitate. Cea mai mare sensibilitate (2-4 dB) organele auditive au o gamă medie frecvență de 2-5 kHz. La alte frecvențe valoarea de prag de sensibilitate poate fi un volum de 40 dB. Cu alte cuvinte, sunete care se afla dincolo de pragul de sensibilitate, nu are sens să se mențină, deoarece acestea încă nu vor fi auzite.

Pe baza acestor efecte este creat un model așa-numitul psihoacustice, împărțind întregul spectru de frecvență a unei porțiuni în care nivelul de zgomot este aproximativ la fel, atunci nu elimină sunetele percepute de persoana așa cum este descris mai sus.

Există trei niveluri de compresie audio MPEG pentru semnale stereo:

1 - raportul de compresie 1: 4 cu un flux de date acceptabil de 384 kbit / s;
2 - 1: 6..1: 256..192 la 8 kbit / s;
3 - 1: 10..1: 128..112 la 12 kbit / s.

Acum să încercăm să înțelegem ce este diferența dintre nivelurile (straturi). De exemplu, un strat de 3 porțiune de spectru rupt mult mai puțin decât în primele două, și de compresie pentru acest motiv, această metodă este cea mai productivă, iar coeficientul său ajunge la 01:12, fără pierderi semnificative de calitate în ureche. Prin urmare, o astfel de fișiere de extindere pe scară largă MP3 (MPEG Layer 3).

Pentru audio cu CD-uri de calitate, necesară pentru a comprima fluxului audio de 256 kbit / s, dar pentru cei mai mulți ascultători și, în cele mai multe aplicații sunt suficiente pentru 128 kbit / s (la 64 kbit / s pe canal). Cu toate acestea, printre un mare număr de codificatoare ar trebui să fie notat câteva fișiere MP3, permițând pentru a comprima numărul curent variabila audio (bitrate variabil), oferind astfel calitatea maximă și economie de spațiu pe disc. Baza acestor codec-uri este de a utiliza, în orice moment dat o anumită valoare a debitului, și, în consecință, timpul de natura a semnalului audio (frecvența și amplitudinea vibrațiilor sonore) care variază. Pentru compresie de vorbire, cu o calitate excelentă suficient de 24 sau 32 kbit / s.

Construcția modelului foarte psihoacustic - un proces matematic complex, plin de calcule în virgulă mobilă. În consecință, un astfel de proces precum procesul de compresie Huffman, necesită o putere de procesare solidă și când decodarea formatelor de fișier MPEG, și mai ales - pentru codificare. Inițial utilizate în acest scop, dispozitive specializate pentru a efectua toate transformările matematice la nivel de hardware, și numai în ultimii ani, după apariția unor procesoare puternice, care pot face față acestor calcule, fără nici un prejudiciu altor aplicații, a devenit posibil cu ajutorul unor programe speciale.

Declarația problemei

Mai mult, două componente auxiliare trebuie să fie dezvoltate:

Ce avem nevoie?

Pentru a pune în aplicare a doua componentă trebuie să fie OLE-încorporarea Windows Media instanță a unui obiect indispensabil pentru toți potențialii studenții noștri, care, de fapt, se va efectua de tamponare și de streaming. Cu toate acestea, rămâne neclar mod de a trece la un parametru, în primul rând, obiect Windows Media este încorporat în documentul HTML, și în al doilea rând, a fost efectuat resursa de streaming de redare.

iar al doilea - HTML- prin următoarea etichetă:

Deci, în primul rând, pentru redarea corectă a unei resurse multimedia, trebuie să-tip MIME înregistrare. Cele de mai sus de tip „audio / MP3 corespunde cu formatul MP3 pista audio-tip MIME. În al doilea caz a indicat fișier ASP-pagină, integrarea componentei efectuează parametrul de reproducere ulterioară indică în continuare #stream, indicând faptul că redarea va fi efectuată în modul de curgere.

Pentru a determina tipul MIME corespunzător de orice fel a fost un format de date diferit (în acest caz, în format AVI), trebuie să utilizați MIME-Configurator Servicii Internet program Manager (vezi. Fig. 2).

prezentarea datelor

În acest caz, framesetul (fișier index.asp) poate fi reprezentat după cum urmează:

În plus, este necesar să se pregătească paginile PlayList.asp Player.asp și pentru punerea în aplicare prima și a doua componente de contact atribuite sarcini.

Acum trebuie să creăm o listă a conținutului acestui director virtual cu MP3-muzică, și cu robinete în subdirectoare, formând astfel toate subdirectoarele din arborele de directoare specificat. Pentru ușurința înțelegerii în cadrul acestui articol vom face pentru un nivel de cuiburi; Mai târziu, va fi posibil să se producă și la un nivel nelimitat de imbricare.

Pentru fiecare fișier audio, trebuie să creăm un link pentru a asculta pagina (în cadrul de jos), trecând ca parametru numele unui fișier audio și setarea modului de streaming.

După cum puteți vedea, programul începe să recupereze calea fizică reală la resurse audio: CaleFolder = Server.MapPath ( „Music“), în cazul în care muzica - nu este altceva decât un nume (alias) din directorul nostru virtual.

În continuare, folosind deja cunoscut la noi, pe baza funcțiilor de grup articol anterior pentru lucrul cu sistemul de fișiere, ciclurile puse în aplicare prin toate subdirectoarele calea fizică specificată în cazul în care, pentru fiecare pentru a genera o listă de subdirectoare și fișierele specificate într-o funcție de director numit ListFolders, care, la rândul său, ListFiles determină funcția de a genera o listă de link-uri către audio într-un singur subdirector.

În cele din urmă, a fost rândul celui de al doilea component, care desfășoară redarea fișierelor audio:

După cum puteți vedea, componenta este pur și simplu generează HTML tag-ul, care încorporează o copie a obiectului Windows Media direct în pagină.