Alors que les majors font fermer the pirate bay par blocage via les FAI et finalement perquisition des serveurs, Youtube regorge de films, de CD, de bandes son diverses, au vu et su de tous, en toute impunité.
La logique la plus basique veut donc qu’il existe un accord entre les maisons de disque, les chaînes, les maisons de production, etc., pour laisser agir google à qui cela procure une certaine audience, du data mining, des revenus publicitaires...
Bref, la légalité de la présence de ces contenus à priori protégés chez google ne nous regarde pas, puisque les contenus en question affichent parfois plusieurs millions de vues dans l’indifférence générale.
Par contre, peut-on les télécharger ?
Peut-on en faire une copie à usage privé au passage ? [1]
Remarque technique : ma méthode est meilleure que celle indiquée sur bien des sites concurrents car elle se fait sans réencodage et donc sans perte de qualité.
Il existe de multiples façons de télécharger ces vidéos, sans difficulté (pas de protection)
Un onglet apparaît sous la vidéo. Choisir le format MP4 (format natif de youtube.) Eviter les Full HD et mp3 HQ 192 kbps, ce sont des réencodages qui passent par le site du plugin : c’est plus lent, de source incertaine et la qualité ne peut être que diminuée par le réencodage et en plus ça double inutilement la taille du fichier pour tromper l’utilisateur lambda qui pensera que c’est mieux).
La qualité du son dépend ici de la taille de la vidéo :
On obtient par ex. Film The Hours - Original Soundtrack.mp4
La bidouille informatique, c’est compliqué en vrai... J’ai écrit cette page avec FAAD au début, qui donne un résultat très correct sur mon PC, avant de découvrir que les fichiers AAC produits sont un peu non standards et ne sont pas lus par mon baladeur (un sansa avec Rockbox).
D’où une réécriture avec MP4Box qu’il faut télécharger et installer par défaut (dans C:\Program Files\GPAC\
).
Pédagogie
Dans une console, taper "C:\Program Files\GPAC\mp4box.exe" -add "F:\Musique\The Hours - Original Soundtrack.mp4#audio:" "F:\Musique\The Hours - Original Soundtrack.m4a"
Et voilà : 96 kbps stéréo MPEG-4 AAC LC
Vraie vie
Pour éviter de taper la commande, on pourra utiliser ce script.
.mp4
sur l’exécutable.mp4
en remplaçant dans ce fichier recycle_mp4=0
par recycle_mp4=1
Version plus pédagogique et il y a rien à installer mais le résultat n’est peut être lisible que sur PC. Cette méthode est déconseillée.
Télécharger FAAD2 is an AAC/MP4 command line audio decoder for Win32 et mettre l’exécutable dans le même répertoire que le MP4.
Ouvrir une console windows ( windows + r ; cmd)
aller dans le répertoire de téléchargement
f:
cd supprimable
(f :\supprimable chez moi par ex.)
lancer faad
faad -a "Film The Hours - Original Soundtrack.aac" "Film The Hours - Original Soundtrack.mp4"
[5]
On obtient Film The Hours - Original Soundtrack.aac
, 41,3 Mo qui se lit très bien sur PC.
Winamp précise que c’est du CBR 96 kbps 44100Hz Stereo. Correct.
Version semi-automatisée avec FAAD
Je remarque que le MP4 pèse 81 Mo, c’est à dire que google ne sait pas encoder un MP4 correctement en H264 : il y a +96% de données inutiles. (Il n’y a qu’une image sur tout l’album.)
Ils ont dû mettre l’encodage en débit fixe au lieu de qualité fixe. S’ils avaient lu Compression d’un ppt filmé commenté en H264 avec avidemux sur mon site, on réduirait de manière mesurable la consommation de débit dans le monde... C’est si gros qu’il doit y avoir erreur... Il faudrait faire une capture de trafic pour vérifier que ce MP4 est bien celui utilisé par défaut. [6]
Ceci est confirmé par une compression en 7zip du MP4 de google qui le réduit à la taille de la bande son. Le fichier est anormalement redondant.
[1] Avis à deux sous d’un non juriste, désolé
[2] ça n’a l’ait de rien, mais écrire des programmes à jour, jolis et pratiques est un boulot plein temps. C’est pas un hasard si mon script gratuit est en interface console, ça m’a pris moins de temps qu’écrire cette page.
[3] Compte tenu de la maturité technologique du AAC, 192 kbps c’est très bien... et 96 relativement aussi sur des enceintes non-HI FI. En pratique la limitation, c’est plus un problème lié à une acquisition analogique du son de qualité "sabotage").
[4] Étrangement la fonction native d’autoit est limitée à ce point et j’ai la flemme de la réécrire sachant qu’il m’arrive rarement de traiter plus de 63 vidéos en une fois. Et quand bien même, ce script est parallélisable à priori.
[5] En écrivant le début et appuyant sur tab on évite de saisir les noms longs.
[6] de toute évidence oui. J’ai écrit à GG, en pure perte, sans doute pour des raisons de complexité hiérarchique évidentes.