Outils pour utilisateurs

Outils du site


compression_de_donnees

Compression de données

La compression de données est une opération informatique à servant à transformer une suite de bits en une autre suite de bits plus courte qui peuvent être restituer, ou sensiblement restituer avec les mêmes informations, en utilisant un algorithme de décompression. Cela permet de d’augmenter la vitesse de transmission des données et de diminuer la taille de stockage des données. Il existe deux types de compression, la compression sans perte et avec perte.

Compression sans perte

Une compression est sans perte lorsqu’il y a aucune donnée sur l’information d’origine n’est perdue. Les données de l’information sont seulement réécrites de façon plus brève. Une des méthodes de compression sans perte est le codage de Huffman.

Compression avec perte

Une compression avec perte est utilisée généralement pour les données sonores ou visuelles. Ils peuvent alors subir une modification importante sans que ce changement ne soit perceptible par un humain normal. Le format MP3 est une forme de compression de fichier audio très populaire, puisque généralement cinq fois moins de places en mémoire pour un même fichier audio en format wav. Quand t’a lui, le format JPEG est une forme de compression de d’une fichier d’image.

Codage de Huffman

Le codage de Huffman a été inventé par David Albert Huffman et publié en 1952. Le codage de Huffman est constitué d’une structure d’arbre composé de nœuds. On commence par calculer le nombre d’occurrence de chaque caractère dans un texte. Chaque caractère est une feuille de cette arbre avec son nombre d’occurrence. L’arbre est créé de la façon suivante : les deux nœuds ayant le nombre d’occurrence le plus faible sont associé ensemble pour créer un nœud parent ayant un nombre d’occurrence égale à celui de la somme des fils. On refait le processus jusqu’à temps qu’il n’y est qu’un seul nœud, la racine. Un embranchement allant vers la gauche est associé au code 0 et un embranchement allant vers la droite est associé au code 1. Ensuite, le code binaire de chaque caractère est obtenu, on descend dans l’arbre à partir de la racine jusqu’à une feuille en ajoutant 0 ou 1 selon la branche suivie. Il faut absolument partir de la racine parce que partir d’une feuille peut provoquer une confusion lors du décodage.

compression_de_donnees.txt · Dernière modification: 2019/04/05 16:47 par 1733518