• 4 Votes
    1 Messages
    58 Vues

    Je vais vous parler aujourd’hui d’un outil vraiment cool pour faire de l’archivage de pages web. Alors oui, je sais, on peut déjà enregistrer une page web avec le navigateur, mais cet outil baptisé Monolith permet de faire 1000 fois mieux que ça. Il va non seulement sauvegarder la page cible, mais aussi embarquer d’un coup tous les éléments CSS, images et JavaScript dans un seul et unique fichier HTML5.

    Et contrairement à une sauvegarde classique ou même avec wget, Monolith intègre tous les assets en URLs de données. Ça veut dire que votre navigateur va pouvoir afficher la page exactement comme elle était sur le web, même sans connexion Internet !

    Pour l’installer, c’est ultra simple. Que vous soyez sur Windows, macOS, GNU/Linux ou même sur des devices exotiques avec des processeurs ARM, ça marchera forcement :

    Avec Cargo (cross-platform) : cargo install monolith Via Homebrew (macOS et GNU/Linux) : brew install monolith Avec Snapcraft (GNU/Linux) : snap install monolith Et plein d’autres options encore…

    Ensuite, pour sauvegarder par exemple cet article de mon site, il vous suffit d’entrer la commande suivante :

    monolith https://korben.info/monolith-archivage-web-html-autonome.html -o monolith.html

    Et paf, ça vous génère direct un fichier monolith.html avec tout ce qu’il faut dedans. Vous pouvez l’ouvrir tranquillou dans votre navigateur même sans accès internet, c’est magique.

    Mais Monolith a encore plein d’autres tours dans son sac. Vous pouvez par exemple l’utiliser directement avec une entrée STDIN :

    cat index.html | monolith -aMcIiFfv -b https://site.com/ - > result.html

    Ici, on lui passe le contenu HTML via l’entrée standard, avec quelques options en plus :

    -a pour virer les audios -M pour ne pas ajouter les infos de date et d’URL -c pour exclure les CSS -I pour isoler le document -i pour retirer les images -F pour exclure les web fonts -f pour zapper les frames -v pour virer les vidéos

    Bref, vous avez un contrôle total sur ce que vous voulez garder ou non.

    Vous pouvez aussi spécifier les domaines autorisés ou interdits pour récupérer les assets, genre :

    monolith -I -d example.com -d www.example.com https://example.com -o example-only.html

    Là on autorise uniquement les domaines example.com et www.example.com. Tout ce qui vient d’ailleurs sera zappé. Ou à l’inverse, on peut dégager des domaines, typiquement ceux qui servent de la pub :

    monolith -I -B -d .googleusercontent.com -d googleanalytics.com -d .google.com https://example.com -o example-no-ads.html

    Après, faut savoir que Monolith n’embarque pas de moteur JavaScript. Donc pour les pages web un peu complexes qui vont chercher des données après le chargement initial, ça peut être limité. Mais pas de panique ! On peut utiliser un navigateur headless comme Chromium en amont, pour pré-processer la page avant de la passer à Monolith :

    chromium --headless --incognito --dump-dom https://github.com | monolith - -I -b https://github.com -o github.html

    Et hop, problème réglé !

    Parfait donc pour les archivistes du web ou les data hoarders qui veulent garder une trace de tout, voire automatiser tout ça dans leurs scripts.

    – Sources :

    https://github.com/Y2Z/monolith/releases/tag/v2.8.1

    https://korben.info/monolith-archivage-web-html-autonome.html

  • 6 Votes
    4 Messages
    110 Vues

    @Violence j’me disais aussi c’est un peu short comme taille

    Faudrais que kkn test voir les limites

  • 1 Votes
    1 Messages
    49 Vues

    Starship est un outil de personnalisation d’invite de commande ultra-rapide, totalement configurable et qui fonctionne avec tout, que vous utilisiez Bash, Zsh, Fish, PowerShell…etc. Cet outil s’intègre en un clin d’œil à votre Shell et vous permettra d’en tirer le meilleur.

    Une fois Starship installé, vous serez vite bluffé par ses capacités de personnalisation puisque vous pourrez configurer chaque aspect de votre shell afin de l’adapter à vos besoins et à vos goûts. Couleurs, symboles, informations affichées… tout est modifiable via le fichier de configuration starship.toml.

    Et si vous travaillez sur plusieurs projets en même temps, pas de problème, Starship affichera « intelligemment » le nom du répertoire courant, la branche Git et l’état de votre dépôt. Et si vous avez besoin d’informations sur la version de Node.js, Python ou Ruby que vous êtes en train d’utiliser, Starship les détectera automatiquement et les intègrera naturellement dans votre prompt.

    https://starship.rs/demo.webm

    Mais Starship ne s’arrête pas là puisqu’il prend en charge une multitude de plugins pour étendre ses fonctionnalités. Ça permet par exemple d’afficher l’état de vos tests, le niveau de batterie de votre ordinateur portable, ou même la météo.

    Et si vous êtes du genre power user, vous apprécierez la rapidité de Starship car contrairement à d’autres outils qui peuvent ralentir votre terminal, il est optimisé pour offrir des performances optimales, sans latence perceptible, même si vous avez poussé la personnalisation à fond !

    L’installation est également un jeu d’enfant. Sur la plupart des systèmes, il vous suffira d’exécuter une simple commande pour télécharger et configurer automatiquement cet outil. Par exemple, sur macOS vous pouvez utiliser Homebrew :

    brew install starship

    Et sur Linux, la commande est tout aussi simple :

    curl -sS https://starship.rs/install.sh | sh

    Si ça vous dit de tester, le site officiel starship.rs est là. Et si vous êtes à la recherche d’inspiration pour personnaliser votre invite de commande, il y a des presets sur le site également.

    – Sources :

    https://starship.rs/

    https://korben.info/starship-invite-de-commande-personnalisable.html

  • 1 Votes
    7 Messages
    212 Vues

    Le premier modèle d’IA de classe GPT-4 que tout le monde peut télécharger est arrivé : Llama 405B

    Dans le monde de l’IA, il y a un buzz dans l’air à propos d’un nouveau modèle de langage d’IA publié mardi par Meta : Llama 3.1 405B . La raison? C’est potentiellement la première fois que n’importe qui peut télécharger classe GPT-4 gratuitement un grand modèle de langage (LLM) de et l’exécuter sur son propre matériel. Vous aurez toujours besoin d’un matériel costaud : Meta indique qu’il peut fonctionner sur un “nœud de serveur unique”, ce qui n’est pas un équipement de qualité PC de bureau. Mais il s’agit d’un tir provocateur de la part des fournisseurs de modèles d’IA « fermés » tels qu’OpenAI et Anthropic.

    Quels que soient les points de référence, les premières rumeurs dans la rue (après la fuite du modèle sur 4chan hier) semblent correspondre à l’affirmation selon laquelle 405B est à peu près équivalent à GPT-4. Il a fallu beaucoup de temps et de formation coûteuse en informatique pour y parvenir – et de l’argent, dont le géant des médias sociaux a beaucoup à dépenser. Meta a entraîné le modèle 405B sur plus de 15 000 milliards de jetons de données d’entraînement extraits du Web (puis analysés, filtrés et annotés par Llama 2), en utilisant plus de 16 000 H100 GPU

    Source et plus: https://arstechnica.com/information-technology/2024/07/the-first-gpt-4-class-ai-model-anyone-can-download-has-arrived-llama-405b/