Le numérique, les codecs et les conteneurs
-
Les signaux numériques.
Autrefois, dans un royaume pas si fort fort lointain d’ailleurs, le monde vivait sous le règne de l’analogique, règne tout simplement basé sur les lois naturelles, relativement faciles à appréhender et à reproduire à notre époque.
Le son, par exemple, est juste une différence de pression de l’air, dont la vitesse de changement de rythme (la fréquence) détermine la hauteur du son, grave pour les battements lents, aigu pour les rapides et la force de cette pression (le volume d’air déplacé, l’amplitude) différencie le murmure du hurlement.
De même pour la lumière, dont la fréquence détermine la couleur, et l’amplitude sa luminosité, en passant par aucune lumière ou couleur (le noir) à la luminosité maximum d’une ou plusieurs couleurs (dans notre domaine on se limitera à ce que perçoit l’œil).
On captait donc ces signaux avec des appareils appropriés, micros, caméras, etc. et on transmettait ces signaux électriquement, magnétiquement, optiquement ou autre, vers un appareil adapté à leur restitution.
Reprenons l’exemple du son, un micro capte les variations de pression de l’air et sa membrane, fait bouger une petite bobine dans un petit aimant. Cette bobine, produit un courant électrique, qui reflète (plus ou moins parfaitement) ces vibrations. Comme le courant de ce dispositif est très faible et que pour faire beaucoup de bruit, il faut de l’énergie, un huluberlu imaginatif a inventé un appareil nommé « Amplificateur » qui se charge d’amplifier le petit courant électrique, afin de le transmettre à une plus grosse bobine qui entoure un plus gros aimant qui va faire bouger une plus grosse membrane d’un autre appareil dénommé haut-parleur.
Voilà, l’analogique, c’est ça, c’est simple non ? Alors, me direz-vous pourquoi changer une affaire qui marche ?
Et bien voilà, les signaux analogiques peuvent être très compliqués à stocker à copier ou à diffuser, souvenez-vous des magnétoscopes à cassettes, et ils sont aussi égoïstes, ils n’aiment pas partager leurs fils électriques, ceux qui possèdent un home-ciné avec beaucoup de haut-parleurs câblés ne me contredirons pas.Bien sûr, on a inventé toutes sortes de choses pour s’affranchir de ces problèmes, mais quelles que soient les astuces utilisées, il vient toujours des limites assez rapidement. De plus, la qualité du signal à tendance à se dégrader à chaque passage dans un appareil (d’ailleurs des appareils semblables n’ont pas tous la même qualité) et cette perte se fait également en fonction de la distance que doit parcourir le signal et d’éventuelles perturbations de celui-ci.
Le numérique, lui, bien que présentant quelques défauts, à tellement d’autres qualités qu’il a très vite été adopté dès que le coût de la technologie l’a permis.
Alors, avant de parler de ses avantages, voyons d’abord brièvement ce qu’est un signal numérique.Un signal utilisable et transmissible par des moyens techniques dans le monde où nous vivons est généralement électrique, mais il peut être également optique ou de toute autre nature, il peut donc s’exprimer en volts, ampères, watts, lumen, gauss ou dieu sait quoi d’autre, pour cette raison je préfère donc parler en pourcents ou le zéro représentera l’absence de lumière ou de bruit et le 100% représentera un maximum arbitraire, comme rendre sourd, péter les membranes d’un haut-parleur, un murmure de ruisseau ou le flash d’un appareil de photo (la douche à photons n’a pas encore été inventée).
Le résultat final ne dépend que de l’amplification.Bref, un signal analogique varie en fonction du temps de manière plus ou moins complexe et peu ressembler parfois à quelque chose comme ça:
Pour le « numériser », on mesure la valeur (de 0 à 100%) du signal à intervalles réguliers, comme ceci :
Mesure après mesure, on obtient une suite de valeurs qui suivent approximativement la courbe.
La précision et la qualité du signal numérique dépendent du nombre de valeurs que l’on mesure par seconde (on nomme cela le débit) et aussi du degré de précision de la mesure d’amplitude.
Petite explication pour le débit. Plus les mesures sont proches (rapides) et moins le signal numérique est déformé, les traits verticaux, sont les seules choses retenues du signal.
Petite explication pour la précision de l’amplitude. Si on ne retient que des valeurs de 0-15 (4 bits) pour le 100 %, les mesures feront aussi de beaux escaliers, déformant également le résultat obtenu.
Voilà par exemple ce que l’on obtiendrait avec un codage sur 4 bits (16 valeurs) et un intervalle de mesure lent, en vert, ce qui n’est pas vraiment très fidèle au signal de départ.Ceux qui ont joué sur de vieilles consoles d’époque ou avec les premiers ordinateurs, ont surement encore dans l’oreille le son criard typique du 8bits…
Pour garantir une bonne qualité aux CDs audio (pour l’époque), on a retenu les valeurs suivantes, un débit de 44.1 kHz, c’est-à-dire 44100 mesures par secondes et pour l’amplitude du signal une conversion sur 16 bits, c’est-à-dire pour des valeurs comprises entre 0 et 100 % une variation de 0 à 65535 ce qui fait des escaliers d’environ 0,0015 % par rapport à la totalité de l’amplitude.
Ces valeurs devaient fournir pour une oreille humaine qui peut percevoir des sons jusqu’à 20khz (pour de très bonnes oreilles, très jeunes) une excellente qualité (par rapport au disque vinyle), mais cela a quand même été jugé insuffisant puisque pour la génération Super Audio CD, SACD (et également pour le DVD Audio), le degré d’exigence est monté à une fréquence d’échantillonnage de 96 kHz (96000 mesures par secondes) et une amplitude de 24 bits (plus de 16 millions de valeurs au lieu de 65000) ce qui devait donner une qualité « correcte » pour les mélomanes les plus exigeants. Sauf que le matériel nécessaire à la reproduction exacte de ces signaux vous pousse à vendre un de vos organes.
Et puisque nous en sommes maintenant là, un simple signal numérisé est dénommé PCM (Pulse Coded Modulation) jusqu’à 48kHz et 16 bits et LPCM pour des valeurs plus élevées, jusqu’à 192kHz en 24 bits (et le L est là pour Linear, ce qui n’est pas très parlant, mais on n’a pas trouvé mieux semble-t’il).
Alors, pourquoi utiliser des valeurs comme 16 bits, 24 bits et autres nombres farfelus, genre 65536 ?
Ce n’est pas comme dans l’antiquité pour se démarquer du « vulgaire », ni parce que le latin et le grec étaient déjà trop employé par l’église et les scientifiques de l’époque, encore moins pour se protéger de l’inquisition, mais tout simplement parce que le numérique, par définition, c’est du tout ou rien, du 1 ou du 0, soit 2 états possibles et pas un de plus (l’informatique quantique va encore « simplifier » tout ça, puisque chaque signal pourra être simultanément 1 et zéro (en même temps donc)).Et alors ? Du fait que les ordinateurs ne peuvent manipuler que deux états, tout y est organisé pour traiter des multiples de 2, soit 2, 4, 8 ,16 ,32, 64, 128, 256… 65536. Et pour que nous, les pauvres humains, puissions utiliser les informations d’un ordinateur, il faut ruser, par exemple, pour l’alphabet, les chiffres et quelques signes ont été « codés » de 0 à 127 (et même que de 0 à 31 pour les télétypes, premières machines à transmettre des caractères), puis 0 à 255 pour ajouter les caractères accentués européens, et au-delà vers l’infini (mais là je m’égare), par exemple, le « A » est le code 65, le « B », 66, bref dans un ordinateur toutes les quantités sont en général codifiées par multiple de 2 et pas par 10, 100, 1000, etc.
Mais, pourquoi 15, 31, 127, 255, 65535, on a parlé de multiple de deux ? Ben oui, mais grâce à l’invention du zéro (nous ne comptons plus avec des chiffres romains) le zéro compte aussi (mais pas double nous ne sommes pas au scrabble), ce qui fait par exemple, que de 0 à 31, nous avons bien 32 possibilités ou valeurs.
Et l’intérêt du numérique par rapport à l’analogique alors ?
Vu que le numérique n’a que deux états possibles, il est beaucoup moins sensible aux interférences que peuvent subir des signaux qui peuvent avoir un nombre presque infini de valeurs (sauf cas limite, comme par exemple un signal de la TNT trop faible qui peut vous gratifier de gels, de superbes gros carreaux colorés et de glitches sonores à vous faire aimer le silence ou le petit dernier). A noter encore que la Télévision Numérique Terrestre est amenée a disparaitre prochainement, remplacée par le streaming sur internet.
Bref, pour en revenir à nos moutons digitaux, la copie d’un ensemble numérique peu se faire un nombre illimité de fois sans perdre une seule information d’une copie à l’autre.
Le mode de stockage ne dépend pas de la nature des informations comme pour l’analogique.
Et enfin, le traitement des données numériques peut-être effectué par un ordinateur avec un simple programme.Révision 1.1
-
Les codecs.
Comme vu précédemment, le numérique, c’est pratique, toutefois pour coller à la réalité le nombre d’informations à gérer peut s’avérer vite énorme et donc coûter très cher en termes de stockage ou de transmission.
Par exemple, le CD audio, pensé pour remplacer un disque vinyle et limité à une durée d’une heure 14 minutes, nécessitait une capacité d’environ 650 millions de bytes (octets) soit une suite de plus de cinq milliards de petits 1 ou 0.
Heureusement, quelqu’un s’est rendu compte que les mathématiques offrent des solutions à ce genre de problème, grâce à des algorithmes de compression.
La pratique est simple (beaucoup plus que la théorie), on prend un groupe de données (ou un fichier complet si le traitement ne doit pas se faire en temps réel, comme la radio ou la tv), on le passe à la moulinette, et soit on le stocke tel quel, soit on le transmet directement à un autre appareil qui recalcule les valeurs d’origines (streaming), ou à peu près.Il existe deux modes de compression, le mode sans perte de données et l’autre qui redonne un signal approximatif, mais qui permet un débit ou une taille (parfois beaucoup) plus faible.
Les sens humains se laissent facilement berner, illusions d’optiques ou sonores en sont la preuve, alors que l’informatique est beaucoup, beaucoup plus sensible aux erreurs (salut écran bleu de la mort).Les modes de compression informatique, tels que zip, rar ou autres sont donc bien entendu sans pertes, car ils doivent pouvoir restituer des programmes sans altération du code, en revanche, les images jpeg ou la musique en mp3 n’ont pas besoin d’une telle fidélité, par contre elles peuvent être facilement dégradées par plusieurs compressions successives, bien qu’un seul traitement parvienne à tromper un maximum de personnes.
Grâce à la compression de données, le même CD audio qui contient au maximum une vingtaine de titres, peut de cette manière en accueillir plus de 200 en format mp3 (par exemple).
Il existe deux sortes d’opérations pour gérer un contenu, la compression et la décompression (ou codeur/décodeur), d’où le terme codec.
Certains appareils ne possèdent qu’un seul élément pour leur usage, un émetteur ne possédera que le mode de compression et le « récepteur » n’aura lui, que la décompression (radio numérique, SACD, DVD, etc.).
S’il existe une très grande variété de codecs, ce n’est pas seulement une question de licences et de royalties, mais aussi d’usage.
Les premiers codecs à avoir été utilisés à grande échelle (outre les images en informatique) ont probablement été des codecs de téléphone portable, le but était de caser un maximum de conversations dans un minimum de place, au début, la qualité du son était assez détestable et il arrive encore que ce soit le cas quand les canaux téléphoniques sont très chargés ou votre abonnement bon marché.
Puis la méthode a été appliquée à toutes sortes de données pour obtenir les résultats ciblés, c’est pour cette raison aussi qu’il existe un grand nombre de codecs et pas que pour des raisons bassement commerciales.
Le but de ce petit discours n’est pas de faire le tri entre le « bon » et le « mauvais » codec, un codec sans perte, tel le flac pour le son, peut donner un résultat sordide si l’échantillonnage est mauvais (la transformation en numérique), comme dans beaucoup de choses, il est nécessaire que tous les éléments de la chaîne soient au moins de qualité égale, un seul maillon faible et le résultat global est au mieux celui du plus mauvais élément.
Il est parfois amusant de voir les querelles des encodeurs sur l’utilisation d’un codec plutôt qu’un autre, ou de tel débit de compression, alors que l’image d’origine peut être excellente, ou constellée de points noirs, voire de qualité déplorable et que la stratégie doit changer pour encoder, car certains codecs ont des réglages plus ou moins détaillés, le codec le plus connu pour son réglage unique est surement le jpg, le mp3 est beaucoup plus souple car il possède beaucoup plus de réglages et permet facilement (hélas) de ratatiner un son pour gagner de la place.
Bien que peu utile pour la compréhension, voici tout de même pour référence, une liste de codecs usuels cela vous permettra de différencier les codecs des conteneurs dont la liste sera donnée aussi plus loin.
Image JPEG · JPEG 2000 · JPEG-LS · JBIG · JBIG2 · PNG · WBMP · HEIF · BMP · BPG · FLIF · GIF · ICER (en) · ILBM · MNG · PCX · PGF · TGA · TIFF · JPEG XR / HD Photo · EMF/WMF · WebP Audio MP3 · MPEG-1 Layer II (en) · MPEG-1 Layer I (en) · AAC · AAC+ · eAAC+ · SBR · Parametric Stereo · MQA · G.711 · G.719 (en) · G.722 · G.722.1 (en) · G.722.2 · G.723 · G.723.1 (en) · G.726 · G.728 · G.729 · G.729.1 · AC3 · AMR · Apple Lossless · ATRAC · CELT · FLAC · iLBC (en) · Monkey’s Audio · Loi µ · Musepack · Nellymoser (en) · OptimFROG · Opus · RealAudio · RTAudio (en) · SHN · Siren (en) · Speex · TAK · Vorbis · WavPack · WMA Vidéo MJPEG · Motion JPEG 2000 · MPEG-1 · MPEG-2 · MPEG-4 ASP · MPEG-4 AVC · MPEG-H HEVC · HEIF· H.120 · H.261 · H.262 · H.263 · H.264 · H.265/HEVC · H.266/VVC · VP3 · VP5 · VP6 · VP7 · VP8 · VP9 · AMV · AV1 · AVS · Bink · Cinepak · Dirac · Indeo · jpg.rem · Pixlet (en) · RealVideo · rem · RTVideo (en) · SheerVideo (en) · Smacker video (en) · Snow · Sorenson · Theora · VC-1 · WMV Et puis, ça ne coûte pas cher et ça me repose.
Révision 1.1
-
Les conteneurs.
Comme nous l’avons vu les codecs servent à créer des flux de données et des fichiers, et à extraire les informations contenues dans ces mêmes flux ou fichiers pour permettre le traitement ou la reproduction des signaux de départ avec plus ou moins de fidélité.
Soit, mais si pour de la musique un codec c’est suffisant, pour un film ou tout autre application nécessitant plusieurs flux, ça n’est plus gérable.
Pas de problème, pour Géo Trouvetout, ce n’est après tout que de la tambouille informatique, il suffit de mettre plusieurs flux ou fichiers ensemble dans quelque chose, tout comme on range des chaussettes et des slips dans un tiroir et le tour est joué.
On ne va pas appeler ça tiroir tout de même, ça n’est pas très vendeur et déjà utilisé, je vous propose, hum, tuyau ? saucisse ? Non ! CONTENEUR !
Un des premiers conteneurs a probablement été le .wav, il permettait (et permet encore d’ailleurs), de mettre plusieurs canaux (L)PCM (souvenez-vous de l’article sur les signaux numériques) dans un seul fichier, au début, de la simple stéréo, et pendant un assez bref laps de temps pour ceux qui ont connu ça, de l’ambiophonie ou quadriphonie (4 canaux), voire plus.
Puis sont apparus rapidement, et pas forcément dans cet ordre, .avi .divx, xvid, etc…
Le .mp3, c’est du tout en un, codec et conteneur, le codec, crée un fichier qui contient les deux canaux. Si les choses sont trop simples, ce n’est pas assez drôle.Certains conteneurs sont limités à quelques codecs (non compatible avec d’autres) et deux ou trois pistes seulement, d’autres comme le mkv, sont bien plus polyvalents et beaucoup moins limités
Il est assez vite apparu clairement, à la grande époque du divx, qu’un fichier multimédia devait pouvoir contenir en plus de la vidéo et plusieurs bandes sonores, des sous-titres, des chapitres, des images, des marqueurs, des informations complémentaires comme langue, piste par défaut, sous-titres forcés, etc.
Mais avant d’aborder la dernière partie, voici une petite liste de conteneurs, toujours sans description, car le but de cet article, n’est pas de vous faire dormir mais de vous permettre d’y voir un peu plus clair.
Conteneurs 3GP · AAF · ASF · AVI · Bink · DMF · DPX · FLV · Matroska · MP4 · MPEG-PS · MPEG-TS · MXF · NUT · Ogg · Ogg Media · OMF · QuickTime · RealMedia · Smacker (en) · Video Object · WebM · AIFF · AU · BWF · CAF · GigaFont · Gus Patch · RF64 · SoundFont · WAV Ceux qui suivent me dirons « il est où le MKV ? », ben c’est le Matroska, si je donne cette précision ici, c’est parce que c’est LE conteneur de l’homme moderne et si cela vous intéresse, je vais vous dire pourquoi, pour les autres, vous pouvez soit éteindre la TV et reprendre une activité normale, soit lire l’article suivant, « Dans la jungle du home cinéma ».
Bien, il reste quelqu’un ? Ah oui, je vois une silhouette au dernier rang, approchez, je ne vais pas vous manger.
Le MKV bien que décrit comme la solution miracle, ne fais pas le café et n’accepte quand même pas tout (ça serait trop beau), je ne vais pas non plus vous souler de détails, si vous en voulez plus, il suffit d’aller chez www.matroska.com ou sur Wikipédia.
Le MKV est actuellement libre de droits (c’est tout bénef), et permet d’encapsuler les codecs suivants :Vidéo DivX, Xvid, RealVideo, H.264, Theora, VP8, H.265, AV1, etc. Audio Vorbis, AAC, MP2, MP3, AC3, DTS, PCM, WV (WavPack) et FLAC. Sous-titres SubRip (srt), SubStation Alpha (ssa), Advanced SubStationAlpha (ass), VobSub (sub/idx), etc. Voilà pourquoi le MKV est si populaire, de plus il sera probablement mis à jour si besoin.
Ah encore une chose s’il reste encore quelqu’un, le Dolby Digital est appelé aussi AC3.
Addendum: le MKV permet maintenant d’encapsuler également des pistes supplémentaires de données colorimétriques, pour le Dolby Vision.
Vous savez maintenant presque tout sur le numérique, mais rien sur les choix à faire pour profiter d’un home cinéma, c’est pourquoi, je vous propose sans aucun supplément, de lire l’article indépendant: “Dans la jungle du home cinéma”.
Vous pouvez aussi poursuivre dans cette voie: Bref survol de l’ère informatique jusqu’à nos jours.
Ou celle-ci: La laborieuse histoire de la télévision.
(même auteur, même collection)Révision 1.1
-
J’étais totalement passé à côté, beau travail @duJambon et merci.