Traduction(s): English - Français
FFmpeg/Libav est une suite de logiciels libres en ligne de commande qui permet de traiter des flux vidéos ou audio. Avec FFmpeg/Libav, on peut déclencher des enregistrements, comme des lectures, appliquer des corrections à l'aide de filtre, ou transcoder des médias d'un format à un autre.
Libav est un fork de FFmpeg que l'on peut retrouver dans les dépôts Debian. Si vous utilisez FFmpeg, il faudra remplacer le mot « avconv » par « ffmpeg ». À part cela, la ligne de commande reste identique.
Contents
Installation
Pour installer Libav :
apt-get install libav-tools
Pour installer le paquet ffmpeg
apt-get install ffmpeg
Attention FFmpeg n'est pas disponible pour Debian 8 Jessie, mais dans les Backports. Pour savoir dans quel dépôt est le paquet, regardez ici libav ou ici ffmpeg . Il est aussi possible de le compiler en suivant les instructions disponibles ici : https://trac.ffmpeg.org/wiki/CompilationGuide/Ubuntu
Utilisation
FFmpeg ou Libav peuvent être manipulés à l'aide de différentes interfaces graphiques :
Ou directement en ligne de commande comme on va le détailler ci-dessous.
Préambule
Une petite introduction aux différentes terminologies de la vidéo peut être utile pour bien comprendre la syntaxe.
Les formats
Le format est le container qui permet le transport de la vidéo, du son et des sous-titres soit sous forme de fichier (mkv, mov...) soit sous forme de flux (MPEG TS). A l’intérieur d'un container on peut insérer (muxer) ou extraire (demuxer) :
- un ou plusieurs flux vidéo (un film, ou des chaînes de télévision....)
- un ou plusieurs flux audio (la version original, la version française, ... )
- un ou plusieurs flux de sous-titres. (Français, Sourd et malentendant, ...)
- plus des métadonnées (titre, nom de l'artiste par exemple)
On parle de multiplexer les différentes pistes (flux ou stream) dans un format.
FFmpeg/Libav fournit une liste des formats qu'il supporte :
avconv -formats
... DE avi AVI (Audio Video Interleaved) DE ogg Ogg D matroska,webm Matroska / WebM E mov QuickTime / MOV D mov,mp4,m4a,3gp,3g2,mj2 QuickTime / MOV E webm WebM ...
- D. = Démultiplexage supporté
- .E = Multiplexage supporté
Les codecs
Le codec est un algorithme qui permet d'encoder la vidéo ou le son afin de l'adapter au protocole de transport (IP,DVB,fichier...) notamment en réduisant le débit(Kbits/s). Selon les codecs, la compression peut s'accompagner d'une perte de qualité dans l'image ou le son plus ou moins importante.
De la même manière que pour les formats, FFmpeg/Libav liste les codecs qu'il est capable de gérer:
avconv -codecs
Les filtres
FFmpeg/Libav dispose aussi d'une base importante de filtre qui permet de modifier le contenu de chaque flux, comme changer la résolution, modifier le volume d'une piste, incruster un logo etc....
avconv -filters
Formats + Codecs + Filtres
Si on résume, FFmpeg/Libav permet de multiplexer ou de-multiplexer dans différents formats:
- des flux vidéos compressés (ou pas),
- des flux audio compressés (ou pas),
- des sous-titres dans différents formats.
Et de modifier, à l'aide de filtre, le contenu de chaque flux indépendamment.
Mais si FFmpeg/Libav peut gérer des tonnes de formats et des tonnes de codecs différents, toutes les combinaisons ne sont pas possibles, comme le montre ce tableau : https://www.videolan.org/streaming-features.html.
En effet, chaque codec ou format comporte sa propre norme avec plus ou moins de licences restrictives, toutes les combinaisons ne sont donc pas possible. \\ Heureusement le libre fournit plusieurs formats ainsi que plusieurs codecs libre de droit :
- Dans les formats citons : mkv, webm, ogv, ogg...
- Dans les codecs vidéos citons : vp9, vp8, theora(vp3), dirac...
- Dans les codecs audio citons : flac, opus, vorbis et bien d'autre...
Connaitre le contenu d'un fichier
Avant de commencer tout encodage il est bon de connaitre son contenu, ffprobe et avprobe permettent de lire l'entête du « format » :
avprobe tears_of_steel.mkv
Ce qui nous retourne ceci :
Input #0, matroska,webm, from 'tears_of_steel.mkv': Metadata: title : ARTIST : COMPOSER : SYNOPSIS : DATE_RELEASED : GENRE : ENCODER : Lavf54.29.104 Duration: 00:12:14.12, start: 0.000000, bitrate: 4615 kb/s Stream #0:0(eng): Video: h264 (Main), yuv420p, 1280x534 [SAR 1:1 DAR 640:267], 24 fps, 24 tbr, 1k tbn, 180k tbc (default) Stream #0:1(eng): Audio: aac, 44100 Hz, stereo, s16 (default) Stream #0:2(eng): Audio: ac3, 48000 Hz, 5.1(side), s16, 448 kb/s (default) Stream #0:3(eng): Subtitle: ssa (default) Stream #0:4(fr): Subtitle: ssa (default)
Ainsi ce fichier, on peut noter que :
- L'input 0 décrit le format du fichier (Matroska ici). (Certain format autorise plusieurs Input, d’où la numérotation)
- Le fichier comprend 5 flux (stream) numérotés de 0 à 4:
- un flux vidéo encodé en h264
- un premier flux audio en stéréo et en anglais
- un deuxième flux audio en anglais 5.1
- et deux sous-titres : un en anglais et un en français.
Changer de Format
On peut facilement changer de format sans toucher au flux :
avconv -i tears_of_steel.mkv -c copy tears_of_steel.mov
- -i spécifie le fichier d'entrée
- -c copy: copie à l'identique la totalité des flux
- -c:v copy : copie à l'identique les pistes vidéos
- -c:a copy : copie à l'identique les pistes audio
- -c:s copy : copie à l'identique les pistes sous-titres
Si on indique pas à ffmpeg de faire la copie exacte des flux, il lancera un profil d'encodage par défaut.
Si l'on souhaite différencier les flux entre eux :
- -c:v:0 première piste vidéo
- -c:a:0 première piste audio
- -c:a:1 deuxième piste audio
- -c:s:0 première piste sous-titre
- -c:s:1 deuxième piste sous-titre
Pour des fichiers comprenant plus de 3 flux, il semble qu'il y ait un bug avec la fonction « copy ». Certain flux sont perdus lors de la copie, il faut passer par la fonction mapping pour pouvoir en copier l'intégralité.
Organiser l'ordre des flux (mapping)
Streams: _________ _________ _________ #0:0 | | | | | | +------->------->| decoder |--->| filters |--->| encoder |--->----+ | |_________| |_________| |_________| | __________ | _________ _________ _________ | ___________ | | | #0:1 | | | | | | | | | | Input #O |----+------->. ,-->| decoder |--->| filters |--->| encoder |--->----+----->| Output #O | |__________| | \ / |_________| |_________| |_________| | |___________| | X _______________________________________ | | #0:2 / \ | | | +------->´ `-->| copy |--->----+ |_______________________________________| \________/ \______/ \________/ demuxer mapping muxer
ffmpeg/libav permet de modifier l'ordre des flux pour les adapter à ses usages à l'aide du paramètre "-map" :
avconv -i tears_of_steel.mkv -map 0:0 -map 0:2 -map 0:1 -map 0:4 -map 0:3 -c copy tears_of_steel-v2.mkv
Dans cette commande j'inverse les deux flux audio entre-eux et ainsi que les deux sous-titres.
- -map 0:1: piste 1 de l'input 0 (tears_of_steel.mkv)
- -map 0:2: piste 2 de l'input 0 (tears_of_steel.mkv)
Lors de l’exécution, ffmpeg indique quel croisement (mapping) il applique :
Stream mapping: Stream #0:0 -> #0:0 (copy) Stream #0:2 -> #0:1 (copy) Stream #0:1 -> #0:2 (copy) Stream #0:4 -> #0:3 (copy) Stream #0:3 -> #0:4 (copy)
Ajouter un flux
Le paramètre -map permet aussi d'ajouter un flux, dans l'exemple qui suit un sous-titre en espagnol (TOS-es.srt) en position 4 :
$ avconv -i tears_of_steel.mkv -i TOS-es.srt -map 0:0 -map 0:1 -map 0:2 -map 1:0 -map 0:3 -map 0:4 -c:v copy -c:a copy -metadata:s:s:0 language=esp tears_of_steel-v2.mkv
- -map 0:0 faisant référence au premier flux du premier "input" : soit la vidéo du fichier "tears_of_steel.mkv"
- -map 1:0 faisant référence au premier flux du deuxième "input" : soit le sous-titre du fichier "TOS-es.srt"
Cela permet de l’insérer où l'on souhaite :
- Stream #0:0(eng): Video: h264 (Main), yuv420p, 1280x534 [SAR 1:1 DAR 640:267], 24 fps, 24 tbr, 1k tbn, 180k tbc (default)
- Stream #0:1(eng): Audio: aac, 44100 Hz, stereo, s16 (default)
- Stream #0:2(eng): Audio: ac3, 48000 Hz, 5.1(side), s16, 448 kb/s (default)
- Stream #0:3(esp): Subtitle: ssa (default)
- Stream #0:4(eng): Subtitle: ssa (default)
- Stream #0:5(fr): Subtitle: ssa (default)
L'option metadata permet de renseigner la langue du fichier :
- -metadata:s:s:0 language=esp
Extraire un flux
En utilisant les possibilités du mapping il est très facile d'extraire un seul flux d'un fichier en comportant plusieurs :
avconv -i tears_of_steel.mkv -map 0:2 -acodec copy tears_of_steel_BO.mkv
Dans cet exemple, on ne copie qu'une seule des pistes audio.
Extraire une piste audio en MP3
Et l'on peut, très bien, faire une conversion dans la foulée :
avconv -i tears_of_steel.mkv -map 0:2 -acodec libmp3lame -ar 44100 -ac 2 -ab 192k tears_of_steel_BO.mp3
Extraire un sous-titre
avconv -i tears_of_steel.mkv -map 0:4 -c:s srt tears_of_steel_FR.srt
Extraire un segment
FFmpeg/Libav permet d'extraire, des morceaux d'un média, en précisant un point d'entrée avec -ss (-ss 00:06:46) et précisant un durée avec -t (-t 00:01:00). Cette fonction est très utile pour faire des tests d'encodage et pour valider sa commande. À noter que -ss et -t doivent être placés devant le premier input (-i).
avconv -ss 00:06:46 -t 00:01:00 -i tears_of_steel.mkv -c copy tears_of_steel_extrait.mkv
Parfois la durée -t n'est pas prise en compte. On peut utiliser l'option -to en la plaçant au niveau du fichier de sortie
avconv -ss 00:06:46 -i tears_of_steel.mkv -c copy -to 00:01:00 tears_of_steel_extrait.mkv
Augmenter le nombre de threads
Selon les codecs, il est possible de lancer une conversion sur plusieurs threads processeurs grâce à l'option threads :
avconv -threads 4 -i tears_of_steel.mkv -c copy tears_of_steel_extrait.mkv
Ici je force le travail sur 4 threads ce qui peut me faire gagner un temps précieux.
-threads 0 correspond au mode automatique et utilisera le maximum de threads disponibles, mais il ne fonctionne pas avec tous les codecs.
Encoder la vidéo
option |
explication de l'option |
-b |
configuration du débit binaire par défaut 200 kbps |
-sameq |
copie à l'identique le débit binaire |
-s |
configuration de la taille du cadre d'affichage |
-aspect |
configuration du format d'affichage (4:3, 16:9 ou 1.3333, 1.7777) |
-vcodec ou -c:v |
décision du choix du codec |
-pass |
nombre de passage à l'encodage, une passe (-pass 1) ou deux passes (-pass 2) |
-qmin |
détermine le seuil minimum du débit binaire variable (VBR) |
-qmax |
détermine le seuil maximum du débit binaire variable (VBR) |
-f |
sélectionne le nom du conteneur |
-r |
définit le nombre d'images par seconde |
Encoder la vidéo en VP8
VP8 est un codec vidéo libre promu par Google, un bon équivalent au h264/mp4 :
avconv -i tears_of_steel_720p.mkv -c:v:0 libvpx -crf 10 -vb 4M -c:a copy tears_of_steel_vp8.mkv
Ici on utilise la librairie libvpx avec deux options :
- -crf permet de définir un niveau de qualité entre 0 et 63 (petit nombre = meilleure qualité mais plus de temps de calcul)
- -vb 4M permet de donner un objectif de débit à 4 Megabit/s
Une liste des options possibles pour encoder en vp8 est disponible ici:
Encoder la vidéo en VP9
VP9 est un codec vidéo libre promu par Google pour concurrencer le h265/HEVC :
ffmpeg -i tears_of_steel_720p.mkv -c:v:0 libvpx-vp9 -threads 8 -crf 10 -vb 4M -c:a copy tears_of_steel_vp9.mkv
Ici on utilise la librairie libvpx-vp9 avec trois options :
- -crf permet de définir un niveau de qualité entre 0 et 63 (petit nombre = meilleure qualité mais plus de temps de calcul)
- -vb 4M permet de donner un objectif de débit à 4 Megabit/s
- -threads reste nécessaire pour forcer le nombre de core, libvpx-vp9 ne les detecte pas encore automatiquement.
Une liste des options possibles pour encoder en vp9 est disponible ici:
vlc rencontre certains problèmes pour décoder le VP9, voir ici : https://trac.videolan.org/vlc/ticket/11763 Mais il est possible de le lire directement avec ffplay :
ffplay tears_of_steel_vp9.mkv
Encoder la vidéo en H264/Mpeg4
Le h264 ou mpeg4 est un codec propriétaire couramment utilisé pour son bon rapport qualité/débit :
avconv -i tears_of_steel_720p.mkv -c:v:0 libx264 -preset slow -crf 22 -c:a copy tears_of_steel_h264.mkv
-preset permet de définir une vitesse d'encodage, plus il sera lent plus l'image sera de qualité. Sont disponibles : ultrafast,superfast, veryfast, faster, fast, medium, slow, slower et veryslow. Medium étant le réglage par défaut.
-crf permet de définir un niveau de qualité entre 0 et 51 (petit nombre = meilleure qualité mais plus de temps de calcul)
Une documentation plus détaillée en anglais est disponible ici : https://trac.ffmpeg.org/wiki/Encode/H.264
Encoder la vidéo en H.265/HEVC
Le H.265/HEVC est un nouveau codec propriétaire, futur successeur du H264/Mpeg4. Les codecs qui le gérent sont récents et toutes les options et optimisations ne sont pas encore disponibles. Pour des temps de calcul plus courts et un meilleur encodage essayez d'optenir une version récente du codec.
La syntaxe suit celle du H264
avconv -i tears_of_steel_720p.mkv -c:v:0 libx265 -preset slow -crf 22 -c:a copy tears_of_steel_h265.mkv
Une documentation plus détaillée en anglais est disponible ici : https://trac.ffmpeg.org/wiki/Encode/H.265 et ici http://x265.readthedocs.org/en/default/
Encoder le son
La liste des options ffmpeg pour le traitement Audio est disponible ici: https://ffmpeg.org/ffmpeg.html#Audio-Options
En voici les principales:
options |
explication des options |
-acodec ou -c:a |
détermine le choix du codec |
-ar |
configuration de la fréquence d'échantillonnage (44100 Hz) |
-ab |
configuration du débit binaire par défaut 64 kbps |
-ac |
configure le nombre de canaux (mono-stéréo) |
Encoder le son en Vorbis
Vorbis est un codec audio libre, d'encodage avec perte, équivalent au mp3/h263 :
avconv -i tears_of_steel_720p.mkv -c:v copy -c:a:0 libvorbis -qscale:a 5 -ar 48000 tears_of_steel_vorbis.mkv
- -qscale:a permet de gérer la qualité d'encodage sur une échelle de 0–10, où 10 est la meilleure qualité. par défaut qscale: a est à 3.
- -ar 48000 permet de ré-échantillonner l'audio en 48Khz.
Encoder un fichier audio en mp3
Plusieurs codec permettent d'encoder le son en mp3, libmp3lame est l'un des plus utilisé. \\ Voici un exemple en forçant le bitrate à 256kbits/s, en ré-échantillonnant en 44100hz et en forçant la fabrication d'un canal stéréo :
avconv -i 01.ogg -acodec libmp3lame -ar 44100 -ac 2 -ab 256k 01.mp3
Attention les métadonnées peuvent être perdues en utilisant cette méthode
Images Fixes
Transformer une série d’images en vidéo
avconv -f image2 -pattern_type glob -i "*.tif" -r 24 outputvideo.mkv
Dans cet exemple, on convertit l'ensemble des fichiers .tif se trouvant dans le dossier courant dans le fichier outputvideo mkv. Mais on peut aussi utiliser d’autres types de format d’images : PGM, PPM, PAM, PGMYUV, JPEG, GIF, PNG, TGA, TIFF, SGI, PTX.
-r 24 permet de spécifier le nombre d'image par seconde.
Attention au débit, les images fixes peuvent être lourdes. Pensez à enchaîner une compression derrière :
avconv -f image2 -pattern_type glob -i "*.tif" -r 24 -c:v:0 libvpx -crf 10 -vb 4M outputvideo.mkv
Transformer une vidéo en une série images
avconv -i video.mpg image%d.jpg
ce qui générera les fichiers image1.jpg, image2.jpg, ... \\ Mais on peut aussi générer des images au format : PGM, PPM, PAM, PGMYUV, JPEG, GIF, PNG, TIFF, SGI. Par exemple :
avconv -i video.mpg image%d.tif
Extraire une seule image (Vignette)
avconv -i fichier_video -f mjpeg -ss 10 -vframes 1 -s 320x240 fichier_vignette.jpg
- -f mjpeg pour obtenir un fichier en format JPG
- -ss 10 pour choisir la vignette de la 10ème seconde après le début de la vidéo
- -vframes 1 la première frame
- -s 320x240 les dimensions de la vignette image JPG.
L'ancien ffmpeg demandait l'option : -f image2 à la place de -f mjpeg maintenant.
Enregistrer son bureau
La capture d'écran vidéo dépend beaucoup des capacités de votre machine, notamment de la vitesse d'écriture des disques et de la rapidité du processeur pour l'encodage temps réel. Il est d'ailleurs conseillé de faire la capture de manière brute et de faire un encodage plus fin par la suite. \\ Si votre machine ne permet d'enregistrer qu'un nombre plus petit d'images que prévu, la vidéo semblera accélérée.
FFmpeg permet de capturer la sortie du serveurX avec le module x11grab :
avconv -f x11grab -r 25 -s 1280x1024 -i :0.0 -vcodec libx264 -crf 0 -preset ultrafast output.mkv
- -i 0:0 représente le premier écran
- -r donne le nombre d'image par seconde
- -s la résolution de la capture
Pour capturer seulement un morceau de l'écran, on peut préciser les coordonnées du point de départ de la capture (x=200 et y= 100) :
avconv -f x11grab -r 25 -s 512x512 -i :0.0+200,100 -vcodec libx264 -crf 0 -preset ultrafast output.mkv
FFmpeg/Libav ne semble pas respecter le nombre d'image par seconde. Si les capacités de la machine le permettent, il pourra aller au-delà, la vidéo sera donc ralentie.
Plus d'informations disponibles sur :
Enregistrer sa webcam
FFmpeg/Libav permet de capturer l'image en provenance d'une Webcam grâce au module video4linux2 :
avconv -f video4linux2 -r 25 -s 640x480 -i /dev/video0 mawebcam.avi
- /dev/video0 pointe vers votre webcam.
- -r 25 force la capture à 25 images par seconde (fps).
- -s 640x480 force la résolution de la capture.
Plus d'information sur la capture avec video4linux2 :
FFmpeg/Libav ne semble pas respecter le nombre d'image par seconde. Si les capacités de la machine le permettent, il pourra aller au-delà, la vidéo sera donc ralentie.
Liens Externes
Site officiel du projet FFmpeg : (en)https://ffmpeg.org/
Documentation FFmpeg : (en)https://trac.ffmpeg.org/wiki
Site officiel du projet Libav : (en)https://libav.org/