HTTrack link patch - [Le calepin du geek]
Le calepin du geek
Geek : Personne s’intéressant à des domaines pointus, avec une once de créativité.

Ceci est un site perso, dans le pur esprit web 1.0, compilant des notes diverses sur des thèmes d’intérêt. (Informatique, programmation, voyage à vélo, réflexions)

HTTrack link patch
Article mis en ligne le 5 mai 2013
par aldoniel
Imprimer cet article logo imprimer

Voir Rédiger un site en hors-ligne avec SPIP et WinHTTrack

 But

  • Contexte : Conversion en html static d’un site web de type CMS hébergé en local (ex : PHP easy, WAMP)
  • Corriger les liens externes crées par WinHTTrack website copier, non téléchargés (404), et convertis par (bug ?) en liens relatifs à un répertoire vide.
    • exemple <a href="../../www.spip.net/index.html" title="Version&nbsp;: 3.0.8 [20422]">SPIP</a>

 Prérequis et limites

  • Lire comment faire la conversion en html static d’un site web de type CMS (ex : SPIP) hébergé en local (cf http://aldoniel.free.fr)
  • Le répertoire racine crée par WinHTTrack doit ressembler à ceci (c’est à dire qu’il doit contenir des répertoires du nom des domaines externes)
localhost
backblue.gif
fade.gif
index.html
hts-log.txt
hts-cache
www.spip.net
www.legifrance.gouv.fr
...
  • (Après recherche, on peut charger des chaines d’environ 100 à 200 Mo en autoit avant de planter l’allocation de mémoire du système en 32 bit, donc, on peut charger en bloc les fichiers html jusqu’à cette taille pour se simplifier la vie.)

 Usage

Lancer 130504SPIP2Static_html_patch_link.au3 ou .exe
Configuration

Les répertoires cibles sont enregistrés dans html_patch_config.ini au 1er lancement. Il faut donner chemins crées par WinHTTrack.
Ensuite, éditer ou supprimer ce fichier pour les changer.

(Si java est installé)

  • On peut optimiser les html (retrait des commentaires, espaces, etc.) pour gagner environ 20% de taille (effet à peu près nul si le serveur comprime les html...)
  • mettre htmlcompressor-1.5.3.jar et yuicompressor-2.4.6.jar dans le même répertoire que 130504SPIP2Static_html_patch_link
  • Attention, le script va écraser les html originaux avec leur version réduite !
PNG - 9.6 ko
Oui, ce programme envoie à la fois des messages en console et par fenêtres...
Cela tient à la fois d’un peu de nostalgie d’un monde passé qui ne reviendra plus où les elfes (sprites...) courraient gaiement sur nos écrans, et surtout d’une incurable flemme de dessiner une GUI (ça prend déjà assez de temps comme ça).
Le vert, c’est une progress bar en texte... Autant ça meuble bien les 3 s. d’exécution sur mon vieux portable, autant c’est instantané sur un appareil neuf. Parfois, je me demande pourquoi j’optimise le code...
P.S. :
  • Il reste un bug (moyennement grave) : Httrack convertit les liens externes en ajoutant index.html à la fin... ex : http://www.spip.net/ —> http://www.spip.net/index.html Pourquoi ??? (encore 30mn - une heure de code en vue...)
  • 2e bug (grave) détecté. Je ne comprends pas très bien pourquoi l’affichage semblait correct jusqu’ici (blague de mon cache ?) mais les liens src= ne sont pas convertis... En attendant la réécriture, le site marche avec un hotfix moche...
    7 Zip - 9.2 ko
Téléchargements Fichiers à télécharger :
  • 130504_spip2static_html_patch_link.zip
  • 1.1 Mo / Zip
  • script_hotfix.7z
  • 9.2 ko / 7 Zip

A télécharger

  • 130504_spip2static_html_patch_link.zip
  • 1.1 Mo / Zip
  • script_hotfix.7z
  • 9.2 ko / 7 Zip


Site réalisé sous SPIP
avec le squelette ESCAL-V3
Version : 3.70.61