Accueil > Grenouille hurlante > Screaming Frog Custom Extractions : Un guide pour l'extraction des données de crawl
Screaming Frog Custom Extractions : Un guide pour l'extraction des données de crawl
Screaming Frog est un puissant outil de référencement doté de nombreuses fonctionnalités d'optimisation des moteurs de recherche. L'une des fonctions les moins connues, Screaming Frog Custom Extractions, vous permet d'extraire facilement des données de vos crawls. Cet article de blog explique comment fonctionne Screaming Frog Custom Extraction et pourquoi il peut vous aider à améliorer vos efforts de référencement !
Les sites web contiennent une tonne d'informations utiles. La plupart du temps, il est trop laborieux ou compliqué de visiter chaque page d'un site web pour copier les données relatives aux produits, métadonnées, balises de titreet texte d'ancrage dans une feuille de calcul. C'est ici que Screaming Frog vient à la rescousse avec des extractions de données personnalisées pour automatiser le processus. Les extractions personnalisées sont une forme de scraping web, la collecte de données sur le web, ou le web extraction de données utilisé pour récupérer et extraire des données de sites web, ce qui vous permet de les stocker localement sur votre ordinateur.
Pour les débutants, quelques questions que vous pourriez vous poser :
Le site Screaming Frog SEO Spider est un robot d'exploration de sites Web qui améliore le référencement sur site en extrayant et en analysant les données de votre site Web à l'aide d'une interface utilisateur graphique (GUI).
Que sont les extractions personnalisées ?
Les extractions sur mesure sont des grenouilles de bénitier SEO pour extraire des informations explicites des pages web. Ces extractions permettent d'optimiser votre site pour Référencement techniquey compris les résultats de recherche, rassemblent des données essentielles sur votre copie, et vous aident à localiser et à corriger les erreurs.
Comment se fait l'extraction des données ?
Le processus d'extraction des données consiste à extraire les données requises sur votre site Web à l'aide d'un araignée Web Screaming Frog. Les informations sont enregistrées dans La mémoire de Screaming FrogVous avez la possibilité d'exporter les résultats de vos numérisations vers les sites suivants Excel ou Google Sheets pour un examen plus approfondi.
Pourquoi l'extraction de données est-elle essentielle ?
L'extraction de données vous permet de récolter rapidement et efficacement de grandes quantités de données. Cette automatisation vous donne des résultats immédiats de architecture web. Ce processus vous permet d'économiser du temps et des ressources tout en vous fournissant les données précieuses dont vous aurez besoin pour planifier et élaborer des stratégies d'optimisation des moteurs de recherche.
Screaming Frog est l'outil de scraping Web par excellence pour les référenceurs. Les options sont infinies ; voici une tonne de syntaxes personnalisées pour le web-scraping.
Comment extraire des données personnalisées avec Screaming Frog ?
1. Dans ScreamingFrog, allez dans Configuration > Personnalisée > Extraction.
Extraction personnalisée Screaming Frog
2. Ensuite, vous devrez +Ajouter et configurez vos règles d'extraction.
Sélectionner des éléments du HTML interne à l'aide de l'onglet Extraction personnalisée
3. Ajoutez un Titre, 4. Sélectionnez si vous avez besoin de CSSPath, XPathou Regex, 5. Ajoutez votre fonction de recherche.
Si vous n'êtes pas sûr du sélecteur ou de la fonction dont vous avez besoin, consultez les exemples ci-dessous ou utilisez la fonction inspecter l'élément dans la section Outils de développement Google Chrome. Vous pouvez ouvrir Dev Tools en utilisant le "clic droit" dans le navigateur Google Chrome.
Exemple :
Voici un exemple de recherche d'un ID de pixel Facebook.
Extraction de l'ID du pixel Facebook
Dans le RésultatsComme vous pouvez le constater, il manque un pixel Facebook sur l'une de mes pages :
Identifiant Facebook manquant
Vous trouverez ci-dessous des ensembles de données d'extraction personnalisés prédéfinis pour vous aider à démarrer.
Syntaxe de base pour l'utilisation de XPath Web Scraping
Isaac Adams-Hands est le directeur du référencement chez SEO North, une entreprise qui fournit des services d'optimisation des moteurs de recherche. En tant que professionnel du référencement, Isaac possède une expertise considérable en matière de référencement sur page, de référencement hors page et de référencement technique, ce qui lui donne une longueur d'avance sur la concurrence.