ISN Formats

Un livre de Wikilivres.

Les formats de données pour les ordinateurs[modifier | modifier le wikicode]

Savoirs :

Les données numériques sont agencées de manière à en faciliter le stockage et le traitement. L'organisation des données numériques respecte des formats qui sont soit des standards de fait, soit des normes.

Capacités :
  • Identifier quelques formats de documents, d'images, de données sonores.
  • Choisir un format approprié par rapport à un usage ou un besoin, à une qualité, à des limites.
Observation :

Le choix d'un format approprié pose le problème de l'interopérabilité, qui est le fait d'assurer un usage sans restriction des mêmes données sur un système différent.

Pour représenter une donnée conséquente, comme une image, un son, une vidéo, un texte structuré, un plan d'architecte ... il existe plus d'une façon d'organiser les valeurs numériques qui les représentent dans un fichier. Chaque programmeur, chaque entreprise qui produit du logiciel, peuvent choisir d'utiliser un format particulier.

Avantages d'utiliser un format non standardisé[modifier | modifier le wikicode]

Dans un premier temps, on peut penser que l'utilisation d'un format inconnu des autres personnes permet de se réserver l'exclusivité de l'exploitation d'un programme.

Cette idée n'est peut-être pas si forte : durant la deuxième guerre mondiale, des formats « non standardisés » très sophistiqués ont été utilisés pour l'échange entre armées allemandes. Les machines Enigma, fleurons de la technologie de cryptage, n'ont pas empêché des mathématiciens anglais, menés par Allan Turing, de casser les codes utilisés.

Avantages d'utiliser un format standardisé[modifier | modifier le wikicode]

Quand un format standard est utilisé, les programmeurs peuvent se focaliser vers le développement de nombreuses applications travaillant avec ce format-là, et les échanges de données sont facilités. Si on veut protéger une donnée confidentielle encodée dans un format standard, on peut utiliser une méthode de chiffrement générique ; nous disposons de méthodes de chiffrement fortes, elles aussi standardisées.

Formats ouverts[modifier | modifier le wikicode]

Un exemple de format fermé : le DOC[modifier | modifier le wikicode]

Il existe des standards de fait, ça a été le cas du format DOC, utilisé par la compagnie Microsoft pour le format texte structuré. Ce format n'est pas spécifié dans un document public, ce qui n'a pas empêché de créer des lecteurs du format DOC pour les concurrents. Il y a plus d'un exemple de fichier DOC enregistré avant 1995 que le logiciel Word de Microsoft ne savait pas ouvrir en l'an 2000, et qu'on a pu récupérer à l'aide du logiciel StarOffice (fabriqué par une société concurrente), qui comportait un filtre d'importation fonctionnant correctement.

Le format GIF[modifier | modifier le wikicode]

La spécification du format GIF était publiée, mais ce format n'était pas ouvert tant que son utilisation était limitée par la législation des brevets. Le dernier brevet portant sur le format GIF s'étant éteint en 2001, on peut le considérer comme ouvert maintenant.

Liste de formats ouverts[modifier | modifier le wikicode]

Un format ouvert, c'est un format de fichier dont on peut trouver une spécification claire et complète, accessible librement à tous.

Utiliser des formats ouverts, c'est s'assurer que les données fabriquées aujourd'hui resteront lisibles dans le futur.

domaine d'utilisation nom des formats
représentation d'images GIF, PNG, JPG, TIFF, TGA, XBM, XPM, MNG, ICO, PPM
représentation de sons WAV, RIFF, FLA, AU, OGG
représentation de vidéos Theora/Vorbis, WebM
représentation de textes structurés TXT, RTF, ODT, DocBook XML, HTML, DOCX à condition que le logiciel n'utilise pas certaines « extensions »
Représentation de pages 2D PS, PDF

Exercices[modifier | modifier le wikicode]

Formats pour traiter le texte[modifier | modifier le wikicode]

Visitez le site de l'organisation Gutenberg et téléchargez une œuvre du domaine public de taille conséquente, à un format que vous pourriez travailler avec un traitement de texte : par exemple, le tome I de la Légende des siècles de Victor Hugo.

Ouvrez ce fichier, puis enregistrez-le aux formats suivants :

  • TXT : format texte pur
  • RTF :format de texte enrichi
  • ODT : format texte OpenDocument
  • DOC (Word 97) : format texte de Microsoft Word
  • DOCX : format texte actuel de Microsoft Word

Ensuite,

  • comparez les tailles de ces fichier
  • essayez de les visualiser avec un simple pageur, qui permet de présenter à l'écran la suite de codes composant le fichier, en format hexadécimal et/ou décodé selon le code ASCII.
  • essayez de décompresser les fichiers dont le code est « illisible » directement avec le pageur, puis examinez et décrivez lz résultat.

Note:
faites votre travail dans un répertoire séparé, pour faciliter la gestion des divers fichiers.

Formats pour traiter le son[modifier | modifier le wikicode]

Trouvez un site qui permette de télécharger de la musique sous une licence Creative Commons, et récupérez un fichier représentant quelques minutes de musique au plus.

Ouvrez ce fichier à l'aide d'un éditeur de son, puis notez tous les renseignements techniques au sujet de l'encodage des sons qui y sont contenus (résolution utilisée, fréquence d'échantillonnage).

Sélectionnez un extrait de moins de trente secondes de ce fichier et jetez le reste. Enregistrez cet extrait aux formats WAV, OGG, MP3. Si possible essayez de varier les paramètres de compression quand ceux-ci sont disponibles. Comparez les tailles des fichiers enregistrés.

Fermer l'éditeur de musique, puis écouter avec attention le même extrait à l'aide d'un logiciel de rendu musical. Y a-t-il des différences qualitatives entre les écoutes des divers formats que vous aviez enregistrés ?

Formats pour traiter des images[modifier | modifier le wikicode]

À l'aide d'une webcam, faites un auto-portrait, puis recadrez-le à l'aide d'un logiciel de traitement d'image, pour faire une sorte de photo d'identité. Normalisez la taille de l'image afin que sa largeur fasse environ 100 pixels (un peu comme pour faire un avatar). Ensuite, enregistrez cette photo aux formats suivants : PNG, XPM, JPG, GIF.

Des paramètres particuliers sont-ils applicables pour l'enregistrement dans certains formats ? Notez bien les paramètres choisis le cas échéant.

Après fermeture du logiciel de traitement d'image, comparez les tailles des divers fichiers. Voyez le contenu du fichier XPM à l'aide d'un éditeur de texte, comparez à d'autres formats (au format texte).

Rouvrez les images des divers fichiers et comparez finement les différences existant entre elles.

En supplément : jusqu'à quel niveau de (basse) qualité pouvez-vous dégrader votre portrait au format JPG, avant de devenir moins reconnaissable ?

À la recherche de formats ouverts[modifier | modifier le wikicode]

Trouvez quels formats sont utilisables pour représenter un plan d'architecte.

Parmi ces formats, lesquels sont ouverts ? Justifiez votre sélection.