Introducción a la compresión de datos: Lempel-Ziv, Gzip

�C�mo se comprime? Utilizando un c�digo. En lugar de los datos que ofrece la fuente se guardan o transmiten otros que son equivalentes, pero que ocupan menos. Se tiene la certeza de que en el momento en que haga falta se podr�n recuperar los datos originales, pero mientras tanto se puede ahorrar espacio en disco o ancho de banda en la transmisi�n haciendo uso de esos datos equivalentes que concentran m�s la informaci�n y eliminan redundancia.

La elecci�n de estos c�digos es tambi�n simple, al menos en concepto: se buscan las secuencias que se repiten m�s y a esas se les asignan palabras c�digo m�s cortas, mientras que a las menos probables se les asignan otras palabras c�digo m�s largas.

No es esta una id�a alejada de la vida cotidiana: si a alguien le est�n dictando, pongamos, "El Quijote", y se pone de acuerdo consigo mismo y con las personas que van a usar su manuscrito en que palabras que se repiten mucho, como "Quijote" y "Sancho", se van a abreviar como "Q." y "S.", ya se ha establecido un c�digo: las secuencias que se repiten son aqu� "Quijote" y "Sancho", y las palabras c�digo que se emplean para comprimir esa informaci�n son "Q." y "S.".

El problema, por tanto, est� en encontrar buenos c�digos para que su longitud esperada est� lo m�s cerca posible de la entrop�a. Estos c�digos son dif�ciles de encontrar, pero existen. El m�s conocido de ellos es el c�digo Huffman, que es capaz de alcanzar el l�mite de la entrop�a, y que en consecuencia se dice que es un c�digo �ptimo.

COMPARTE ESTE ARTÍCULO

COMPARTIR EN FACEBOOK
COMPARTIR EN TWITTER
COMPARTIR EN LINKEDIN
COMPARTIR EN WHATSAPP
ARTÍCULO ANTERIOR

SIGUIENTE ARTÍCULO