Introducción a la compresión de datos: Lempel-Ziv, Gzip

¿Cómo se comprime? Utilizando un código. En lugar de los datos que ofrece la fuente se guardan o transmiten otros que son equivalentes, pero que ocupan menos. Se tiene la certeza de que en el momento en que haga falta se podrán recuperar los datos originales, pero mientras tanto se puede ahorrar espacio en disco o ancho de banda en la transmisión haciendo uso de esos datos equivalentes que concentran más la información y eliminan redundancia.

La elección de estos códigos es también simple, al menos en concepto: se buscan las secuencias que se repiten más y a esas se les asignan palabras código más cortas, mientras que a las menos probables se les asignan otras palabras código más largas.

No es esta una idéa alejada de la vida cotidiana: si a alguien le están dictando, pongamos, "El Quijote", y se pone de acuerdo consigo mismo y con las personas que van a usar su manuscrito en que palabras que se repiten mucho, como "Quijote" y "Sancho", se van a abreviar como "Q." y "S.", ya se ha establecido un código: las secuencias que se repiten son aquí "Quijote" y "Sancho", y las palabras código que se emplean para comprimir esa información son "Q." y "S.".

El problema, por tanto, está en encontrar buenos códigos para que su longitud esperada esté lo más cerca posible de la entropía. Estos códigos son difíciles de encontrar, pero existen. El más conocido de ellos es el código Huffman, que es capaz de alcanzar el límite de la entropía, y que en consecuencia se dice que es un código óptimo.

COMPARTE ESTE ARTÍCULO

ENVIAR A UN AMIGO
COMPARTIR EN FACEBOOK
COMPARTIR EN TWITTER
COMPARTIR EN GOOGLE +
ARTÍCULO ANTERIOR

SIGUIENTE ARTÍCULO

¡SÉ EL PRIMERO EN COMENTAR!
Conéctate o Regístrate para dejar tu comentario.