Omjer kompresije. Sažimanje informacija Zahtjevi sustava za algoritmima

Svaka tvar pod utjecajem vanjskog tlaka može se stlačiti, odnosno promijenit će svoj volumen na jedan ili drugi stupanj. Dakle, plinovi s povećanim tlakom mogu vrlo značajno smanjiti njihov volumen. Tekućina je podložna promjenama volumena u manjoj mjeri kada se promijeni vanjski tlak. Još je manja stišljivost krutina. Kompresibilnost odražava ovisnost fizička svojstva tvari iz udaljenosti između njezinih molekula (atoma). Kompresibilnost karakterizira omjer kompresije (Isto kao: omjer kompresibilnosti, omjer kompresije, volumetrijski omjer elastičnog širenja).

DEFINICIJA

Omjer kompresije - ovo fizička veličina, jednako relativnoj promjeni volumena podijeljenoj s promjenom tlaka koja uzrokuje promjenu volumena tvari.

Postoje razne oznake za omjer kompresije, najčešće slova ili. Kao formula, omjer kompresije zapisuje se kao:

pri čemu znak minus odražava činjenicu da porast tlaka dovodi do smanjenja volumena i obrnuto. U diferencijalnom obliku koeficijent se definira kao:

Volumen je povezan s gustoćom tvari, stoga za procese promjene tlaka pri konstantnoj masi možete napisati:

Vrijednost stupnja kompresije ovisi o prirodi tvari, njezinoj temperaturi i tlaku. Uz sve navedeno, omjer kompresije ovisi o vrsti postupka u kojem se mijenja tlak. Dakle, u izotermičkom procesu omjer kompresije razlikuje se od omjera kompresije u adijabatskom procesu. Izotermni omjer kompresije definiran je kao:

gdje je parcijalni derivat pri T \u003d const.

Stupanj adijabatske kompresije može se naći kao:

gdje je parcijalni derivat pri konstantnoj entropiji (S). Za krutine se izotermni i adijabatski faktori stišljivosti vrlo malo razlikuju i ta se razlika često zanemaruje.

Postoji veza između adijabatskog i izotermnog koeficijenta stišljivosti, što se odražava jednadžbom:

gdje su i specifična toplina pri konstantnom volumenu i tlaku.

Jedinice omjera kompresije

Osnovna SI mjerna jedinica za faktor stišljivosti je:

Primjeri rješavanja problema

PRIMJER 1

Načela kompresije informacija

Bilo koja metoda kompresije informacija temelji se na modelu izvora informacija, ili, točnije, modelu redundancije. Drugim riječima, za komprimiranje informacija koriste se neke informacije o tome kakve se informacije komprimiraju - bez ikakvih informacija o informacijama ne može se apsolutno pretpostaviti koja će transformacija smanjiti volumen poruke. Te se informacije koriste u procesu kompresije i dekompresije. Model redundancije također se može izgraditi ili parametrirati tijekom faze kompresije. Metode koje omogućuju promjenu modela redundancije informacija na temelju ulaznih podataka nazivaju se adaptivnim. Neadaptibilni su obično usko specifični algoritmi koji se koriste za rad s dobro definiranim i nepromijenjenim karakteristikama. Ogromna većina dovoljno univerzalnih algoritama prilagodljiva je u jednom ili drugom stupnju.

Bilo koja metoda kompresije podataka uključuje dvije međusobno obrnute pretvorbe:

  • pretvorba kompresije;
  • pretvorba proširenja.

Transformacija kompresije pruža komprimiranu poruku iz originala. Dekompresija osigurava primanje izvorne poruke (ili njezine aproksimacije) iz komprimirane.

Sve metode kompresije podijeljene su u dvije glavne klase

  • nema gubitka,
  • s gubicima.

Temeljna razlika između njih je ta što kompresija bez gubitaka pruža mogućnost precizne rekonstrukcije izvorne poruke. Sažimanje s gubitkom omogućuje vam da dobijete samo određenu približnu vrijednost izvorne poruke, odnosno različitu od izvorne, ali unutar nekih unaprijed zadanih pogrešaka. Te bi pogreške trebao utvrditi drugi model - model prijemnika, koji određuje koji se podaci i s kojom točnošću prezentiraju prijamniku, a koje je prihvatljivo odbaciti.

Karakteristike i algoritmi kompresije

Omjer kompresije

Omjer kompresije glavna je karakteristika algoritma kompresije, koja izražava glavnu kvalitetu aplikacije. Definira se kao omjer veličine nekomprimiranih podataka i komprimiranih podataka, odnosno:

k = S o / S c,

gdje k - omjer kompresije, S o je veličina nekomprimiranih podataka i S c - veličina komprimiranog. Dakle, što je veći omjer kompresije, to je algoritam bolji. Treba napomenuti:

  • ako k \u003d 1, tada se algoritam ne komprimira, odnosno prima izlaznu poruku veličine jednake ulaznoj;
  • ako k < 1, то алгоритм порождает при сжатии сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situacija s k < 1 вполне возможна при сжатии. Невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что количество различных сообщений длиной n Uzorak: E: bit je točno 2 n ... Zatim broj različitih poruka duljine manje ili jednake n (ako postoji barem jedna kraća poruka) bit će manja od 2 n ... To znači da je nemoguće jednoznačno povezati sve izvorne poruke sa komprimiranom: ili neke od izvornih poruka neće imati komprimirani prikaz, ili će nekoliko izvornih poruka odgovarati istoj komprimiranoj, što znači da ih nije moguće razlikovati.

Omjer kompresije može biti ili konstantan omjer (neki algoritmi kompresije za zvuk, slike itd., Na primjer, A-zakon, μ-zakon, ADPCM) ili promjenjivi. U drugom se slučaju može odrediti ili za određenu poruku, ili procijeniti prema nekim kriterijima:

  • prosjek (obično za neki testni skup podataka);
  • maksimum (slučaj najbolje kompresije);
  • minimalna (najgori slučaj kompresije);

ili neki drugi. Omjer kompresije s gubitkom u ovom slučaju snažno ovisi o dopuštenoj pogrešci kompresije ili njezinoj kvalitetu, koji obično djeluje kao parametar algoritma.

Tolerancija gubitka

Glavni kriterij za razlikovanje algoritama kompresije je prisutnost ili odsutnost gore opisanih gubitaka. Općenito, algoritmi kompresije bez gubitaka svestrani su u smislu da se mogu primijeniti na bilo koju vrstu podataka, dok upotreba kompresije gubitaka mora biti opravdana. Neke vrste podataka ne prihvaćaju bilo kakav gubitak:

  • simbolički podaci, čija promjena neizbježno dovodi do promjene njihove semantike: programa i njihovih izvornih kodova, binarnih nizova itd .;
  • vitalni podaci, čije promjene mogu dovesti do kritičnih pogrešaka: na primjer, dobiveni iz medicinske mjerne opreme ili upravljačkih uređaja zrakoplova, svemirskih letjelica itd.
  • podaci koji su opetovano komprimirani i dekompresirani: radne grafičke, zvučne, video datoteke.

Međutim, kompresija s gubitkom omogućuje vam postizanje mnogo većih omjera kompresije odbacivanjem beznačajnih podataka koji se ne komprimiraju dobro. Tako, na primjer, algoritam kompresije zvuka bez gubitaka FLAC, u većini slučajeva, omogućuje komprimiranje zvuka 1,5-2,5 puta, dok algoritam Vorbis s gubitkom, ovisno o postavljeni parametar Kvaliteta se može komprimirati do 15 puta uz zadržavanje prihvatljive kvalitete zvuka.

Zahtjevi sustava algoritma

Različiti algoritmi mogu zahtijevati različitu količinu resursa računalnog sustava na kojem se izvode:

  • rAM (za srednje podatke);
  • trajna memorija (za programski kod i konstante);
  • vrijeme procesora.

Ti zahtjevi općenito ovise o složenosti i "inteligenciji" algoritma. Kao opći trend, što je algoritam bolji i svestraniji, to više zahtjeva postavlja prema stroju. Međutim, u određenim slučajevima jednostavni i kompaktni algoritmi mogu imati bolju izvedbu. Zahtjevi sustava određuju njihove potrošačke kvalitete: što je algoritam manje zahtjevan, to jednostavniji, pa prema tome kompaktni, pouzdani i jeftini sustav može raditi.

Budući da algoritmi kompresije i dekompresije rade u parovima, omjer zahtjevi sustava njima. Često možete zakomplicirati jedan algoritam, a možete uvelike pojednostaviti drugi. Dakle, možemo imati tri mogućnosti:

Algoritam kompresije mnogo je zahtjevniji za resurse od algoritma dekompresije. Ovo je najčešći odnos, a uglavnom je primjenjiv u slučajevima kada će se jednom komprimirani podaci koristiti više puta. Primjeri uključuju digitalne audio i video uređaje. Algoritmi kompresije i dekompresije imaju približno jednake zahtjeve. Najprihvatljivija opcija za komunikacijsku liniju kada se kompresija i dekompresija javljaju jednom na svoja dva kraja. Na primjer, to može biti telefonija. Algoritam kompresije je znatno manje zahtjevan od algoritma dekompresije. Sasvim egzotičan slučaj. Može se koristiti u slučajevima kada je odašiljač ultra prijenosni uređaj, gdje je količina dostupnih resursa vrlo kritična, na primjer, svemirska letjelica ili velika distribuirana mreža senzora, ili može raspakirati podatke potrebne u vrlo mali postotak slučajeva, na primjer, snimanje CCTV kamera.

vidi također


Zaklada Wikimedia. 2010.

Pogledajte što je "Kompresija informacija" u drugim rječnicima:

    kompresija informacija - objedinjavanje informacija - [L.G. Sumenko. Englesko-ruski rječnik informacijske tehnologije. M.: GP TsNIIS, 2003.] informacijska tehnologija općenito Sinonimi smanjenje informacija EN smanjenje podataka ...

    KOMPRESIRANJE INFORMACIJA - (kompresija podataka) prikaz podataka (podataka) u manje bitova od originala. Na temelju uklanjanja suvišnosti. Razlikovati S. i. bez gubitka informacija i uz gubitak nekih podataka koji su beznačajni za zadatke koji se rješavaju. Da ... Enciklopedijski rječnik psihologije i pedagogije

    adaptivna kompresija bez gubitaka - - [L.G. Sumenko. Englesko-ruski rječnik informacijske tehnologije. Moskva: GP TsNIIS, 2003.] Teme informacijskih tehnologija općenito EN adaptivno sažimanje podataka bez gubitakaALDC ... Vodič za tehničkog prevoditelja

    kompresija / kompresija informacija - - [L.G. Sumenko. Englesko-ruski rječnik informacijske tehnologije. M.: GP TsNIIS, 2003.] Teme informacijskih tehnologija u općem zbijanju EN ... Vodič za tehničkog prevoditelja

    digitalna kompresija informacija - - [L.G. Sumenko. Englesko-ruski rječnik informacijske tehnologije. M.: GP TsNIIS, 2003.] Teme informacijskih tehnologija u općem EN kompresiji ... Vodič za tehničkog prevoditelja

    Zvuk je jednostavan val, a digitalni signal je prikaz tog vala. To se postiže pohranjivanjem amplitude analognog signala više puta unutar jedne sekunde. Na primjer, na običnom CD-u signal se pamti 44100 puta u ... ... Wikipediji

    Proces koji smanjuje količinu podataka smanjenjem suvišnosti. Kompresija podataka uključuje sažimanje dijelova podataka standardne veličine. Razlikuju se kompresija bez gubitaka i kompresija bez gubitaka. Na engleskom: Podaci ... ... Financijski rječnik

    kompresija podataka s digitalne karte - Obrada digitalnih kartografskih podataka kako bi se smanjio njihov volumen, uključujući uklanjanje suvišnosti unutar potrebne točnosti njihova prikazivanja. [GOST 28441 99] Teme digitalna kartografija Generaliziranje pojmova metode i tehnologije ... ... Vodič za tehničkog prevoditelja

Omjer kompresije glavna je karakteristika algoritma kompresije. Definira se kao omjer volumena izvornih nekomprimiranih podataka i volumena komprimiranih podataka, odnosno :, gdje k- omjer kompresije, S o je količina početnih podataka, i S c - komprimirani volumen. Dakle, što je veći omjer kompresije, algoritam je učinkovitiji. Treba napomenuti:

    ako k\u003d 1, tada se algoritam ne komprimira, to jest, izlazna poruka je po volumenu jednaka ulaznoj;

    ako k< 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Situacija s k< 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длинойnbit je točno 2 n , broj različitih poruka duljine manje ili jednake n(ako postoji barem jedna kraća poruka) bit će manja od 2 n ... To znači da je nemoguće jednoznačno povezati sve izvorne poruke sa komprimiranom: ili neke od izvornih poruka neće imati komprimirani prikaz, ili će nekoliko izvornih poruka odgovarati istoj komprimiranoj, što znači da ih nije moguće razlikovati. Međutim, čak i kada algoritam kompresije povećava veličinu izvornih podataka, lako je osigurati da se njihova veličina ne može povećati za više od 1 bit. Tada će se, čak i u najgorem slučaju, dogoditi nejednakost: To se radi na sljedeći način: ako je količina komprimiranih podataka manja od izvornika, vratite komprimirane podatke dodavanjem "1", u suprotnom vraćamo izvorne podatke dodavanjem im "0"). Primjer kako se to implementira u pseudo-C ++ prikazan je u nastavku:

bin_data_t __compess (bin_data_t input) // bin_data_t je vrsta podataka koja znači proizvoljan slijed bitova promjenjive duljine

bin_data_t izlaz \u003d luk (ulaz); // funkcija bin_data_t arch (bin_data_t input) implementira neki algoritam kompresije podataka

if (output.size ()

output.add_begin (1); // funkcija bin_data_t :: add_begin (bool __bit__) dodaje malo jednako __bit__ na početak slijeda

povratni izlaz; // vraća komprimirani niz s dodanim "1"

else // inače (ako je količina komprimiranih podataka veća ili jednaka izvornoj veličini)

input.add_begin (0); // dodamo "0" izvornom nizu

povratni ulaz; // vratimo izvornu datoteku s dodanom "0"

Omjer kompresije može biti ili konstantan (neki algoritmi kompresije za zvuk, sliku itd., Na primjer, A-zakon, μ-zakon, ADPCM, skraćeno kodiranje blokova) ili varijabilni. U drugom se slučaju može odrediti za svaku određenu poruku ili procijeniti prema nekim kriterijima:

    prosjek (obično za neki testni skup podataka);

    maksimum (slučaj najbolje kompresije);

    minimalna (najgori slučaj kompresije);

ili štogod. Stupanj kompresije s gubitkom u ovom slučaju uvelike ovisi o dopuštenoj pogrešci kompresije ili kvalitetu, koji obično djeluje kao parametar algoritma. Općenito, samo tehnike kompresije podataka s gubicima mogu osigurati konstantan omjer kompresije.

Glavni kriterij za razlikovanje algoritama kompresije je prisutnost ili odsutnost gore opisanih gubitaka. Općenito, algoritmi kompresije bez gubitaka univerzalni su u smislu da je njihova upotreba zasigurno moguća za bilo koju vrstu podataka, dok bi mogućnost upotrebe kompresije s gubicima trebala biti opravdana. Za neke vrste podataka izobličenje u načelu nije prihvatljivo. Među njima

    simbolički podaci, čija promjena neizbježno dovodi do promjene njihove semantike: programi i njihovi izvorni kodovi, binarni nizovi, itd .;

    vitalni podaci, čije promjene mogu dovesti do kritičnih pogrešaka: na primjer, dobiveni iz medicinske mjerne opreme ili upravljačkih uređaja zrakoplova, svemirskih letjelica itd .;

    srednji podaci opetovano komprimirani i obnavljani u višestupanjskoj obradi grafičkih, audio i video podataka.

Osam epizoda u sezoni još uvijek nije dovoljno za takvu seriju, priča se nije imala vremena stvarno razviti, ali ipak se pitam što će biti dalje, što je dobro. Štoviše, potvrđena je i druga sezona. Posljednja epizoda je ipak bila prilično dosadna.

Tim plaćenog Peipera iskoristio je Ehrlichove modrice tijekom predstavljanja. Prvo, uprava konferencije, uplašena mogućom tužbom (zvao je odvjetnik-gitarist), ponudila je Paid Piperu da ide u sljedeći krug bez konkurencije, a drugo, Ehrlich im je također nokautirao apartman u hotelu.


Ehrlich, iako vrlo zagušljiv, i dalje je koristan. Ekipa bi trebala imati takvu osobu - arogantnu poput traktora, nabrijanog, samozadovoljnog optimistu, koja uvijek ima idiotsku ideju i može udariti gadnog dječačića. I nemaju svi duha za to.

Čini se da je sve u redu, ali vođe startupa su pogledali Belsonovu prezentaciju, a on je predstavio ne samo opsežni projekt s hrpom različitih funkcionalnosti, budući da Hooley ima puno usluga koje se mogu integrirati, već i određene Weismanov koeficijent, odnosno omjer kompresije, ima isti kao i Pay Piper. Weisman Factor posebno su za emisiju stvorila dva savjetnika sa Stanforda, Weisman i Misra.

Općenito se ispostavlja da su gadni konkurenti unatoč tome uništili Richardov algoritam obrnutim inženjeringom. Plaćena Piper sutra nema što pokazati.

Ehrlich je pokušao trolati Belsona, optužujući ga za sve smrtne grijehe od alkoholizma do seksualnog uznemiravanja, Jared je poludio, a Dinesh i Guilfoyle pokušali su pronaći novi posao.

Navečer, kad je Jared pušten iz policije, svi su se okupili u hotelu i počeli razmišljati što učiniti. Nitko se ne želi sutra podvrgnuti javnom pogubljenju, osim Ehrlicha, naravno, koji vjeruje da su javna pogubljenja vrlo popularna i da je općenito sve ovo show business. U svakom slučaju, pobijedit će, čak i ako osobno mora drkati svakog tipa u teretani. Ova je ideja primljena s velikim udarom, jer, kao što sam nedavno napisao, programere može zanijeti bilo koji zadatak i nije ih briga je li zlonamjeran ili glup. Dok su računali pod kojim će uvjetima Ehrlich svima pružiti ruku u najkraćem mogućem roku, Richard je imao ideju.

Ne, ovo nije Richardova ideja,

Ovo je tim Plaćene Piper koji rješava problem Ehrlicha.

Kao što pretpostavljate, sve je dobro završilo i Payde Piper dobila je 50 tisuća dolara. A Peter Gregory rekao im je da se ne uzrujava.

Najviše od svega, žao mi je što Petera Gregoryja više nećemo vidjeti. Ovo je bio najbolji lik ikad. Ne znam hoće li sudac Paid Piper pronaći drugog investitora jednako ludog.





Zadatak Pustite kocku van čvrsta tvar s bokom jednakim doživljava svestrani pritisak. Stranica kocke smanjena je za. Izrazite omjer kompresije kocke ako se pritisak na nju promijeni u odnosu na početnu za
Odluka Napravimo crtež.


U skladu s definicijom stupnja kompresije, pišemo:

Budući da je promjena na strani kocke uzrokovana pritiskom jednaka, tada se volumen kocke nakon kompresije () može predstaviti kao:

Stoga relativnu promjenu volumena zapisujemo kao:

Količina je mala, pa to pretpostavljamo jednaki nuli, tada možemo pretpostaviti da:

Zamijenimo relativnu promjenu volumena iz (1.4) u formulu (1.1), imamo:

Odgovor