{"id":2446,"date":"2021-03-10T17:52:12","date_gmt":"2021-03-10T17:52:12","guid":{"rendered":"https:\/\/seonorth.ca\/?page_id=2446"},"modified":"2025-02-15T21:17:48","modified_gmt":"2025-02-15T21:17:48","slug":"custom-extraction","status":"publish","type":"page","link":"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/","title":{"rendered":"Screaming Frog Custom Extractions : Un guide pour l'extraction des donn\u00e9es de crawl"},"content":{"rendered":"<p>Screaming Frog (screamingfrog.co.uk) est un outil de r\u00e9f\u00e9rencement puissant qui offre de nombreuses fonctionnalit\u00e9s d'optimisation pour les moteurs de recherche, notamment les extractions personnalis\u00e9es, qui vous permettent d'extraire facilement des donn\u00e9es de vos crawls. Cet article de blog explique comment fonctionne l'extraction personnalis\u00e9e de Screaming Frog et pourquoi elle peut vous aider \u00e0 am\u00e9liorer vos efforts de r\u00e9f\u00e9rencement, votre marketing num\u00e9rique de commerce \u00e9lectronique et vos strat\u00e9gies d'indexation.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"683\" data-attachment-id=\"2452\" data-permalink=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/screaming-frog-custom-extractions\/\" data-orig-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg\" data-orig-size=\"1600,1067\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;\\u00a9kikkerdirk - stock.adobe.com&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"screaming-frog-custom-extractions\" data-image-description=\"\" data-image-caption=\"\" data-medium-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-300x200.jpg\" data-large-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-1024x683.jpg\" src=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-1024x683.jpg\" alt=\"Extraction personnalis\u00e9e Screaming Frog\" class=\"wp-image-2452 img-fluid\" srcset=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-1024x683.jpg 1024w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-300x200.jpg 300w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-768x512.jpg 768w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-1536x1024.jpg 1536w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions-18x12.jpg 18w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg 1600w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Les sites Web contiennent une tonne d'informations utiles. La plupart du temps, il est trop laborieux ou compliqu\u00e9 de visiter chaque page d'un site Web pour copier les donn\u00e9es produit, les m\u00e9tadonn\u00e9es, les balises de titre et le texte d'ancrage dans une feuille de calcul. C'est l\u00e0 que Screaming Frog vient \u00e0 la rescousse avec des extractions de donn\u00e9es de recherche personnalis\u00e9es, en utilisant des API et des expressions r\u00e9guli\u00e8res pour automatiser le processus. Les extractions personnalis\u00e9es sont une forme de web scraping, de web harvesting ou d'extraction de donn\u00e9es web utilis\u00e9e pour r\u00e9cup\u00e9rer et extraire des donn\u00e9es de sites web, ce qui vous permet de les stocker localement sur votre ordinateur.<\/p>\n\n\n\n<p>Pour les d\u00e9butants, quelques questions que vous pourriez vous poser :<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Quel est le <\/strong><strong>Screaming Frog SEO Spider<\/strong><strong>?<\/strong><\/h2>\n\n\n\n<p>Le logiciel Screaming Frog SEO Spider est un robot d'exploration de sites web qui am\u00e9liore le r\u00e9f\u00e9rencement sur site en extrayant et en analysant les donn\u00e9es structur\u00e9es de votre site web \u00e0 l'aide d'une interface utilisateur graphique (GUI), en g\u00e9rant efficacement les contenus XML et JavaScript.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Quels sont les <\/strong><strong>extractions sur mesure<\/strong><strong>?<\/strong><\/h2>\n\n\n\n<p>Les extractions personnalis\u00e9es sont des fonctions de l'araign\u00e9e SEO de Screaming Frog qui permettent d'extraire des informations explicites des pages Web. Ces extractions aident \u00e0 optimiser votre site pour un audit SEO technique, y compris les r\u00e9sultats de recherche, en recueillant des donn\u00e9es essentielles sur votre copie, et en aidant \u00e0 localiser et \u00e0 corriger les erreurs dans les en-t\u00eates et d'autres \u00e9l\u00e9ments.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Comment se fait l'extraction des donn\u00e9es ?<\/strong><\/h2>\n\n\n\n<p>Utilisez Screaming Frog si vous souhaitez proc\u00e9der \u00e0 l'extraction de donn\u00e9es, qui consiste \u00e0 extraire les donn\u00e9es requises de votre site web. Les informations sont enregistr\u00e9es dans la m\u00e9moire de Screaming Frog, ce qui vous permet d'exporter les r\u00e9sultats de l'analyse vers Excel ou Google Sheets pour un examen plus approfondi. Il peut s'agir de donn\u00e9es provenant de menus d\u00e9roulants et de structures de liens internes.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Pourquoi l'extraction de donn\u00e9es est-elle essentielle ?<\/strong><\/h2>\n\n\n\n<p>L'extraction de donn\u00e9es vous permet de r\u00e9colter de grandes quantit\u00e9s de donn\u00e9es rapidement et efficacement. Cette automatisation vous donne des r\u00e9sultats imm\u00e9diats sur l'architecture web. Ce processus vous permet d'\u00e9conomiser du temps et des ressources tout en vous fournissant les donn\u00e9es pr\u00e9cieuses dont vous avez besoin pour planifier et \u00e9laborer des strat\u00e9gies d'optimisation pour les moteurs de recherche. Screaming Frog est l'outil de scraper Web le plus utilis\u00e9 par les r\u00e9f\u00e9renceurs et un extracteur de donn\u00e9es. Les options sont infinies ; il y a une tonne de syntaxes de web-scraping personnalis\u00e9es. Consultez le tutoriel ci-dessous.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Comment extraire des donn\u00e9es personnalis\u00e9es avec Screaming Frog ?<\/h2>\n\n\n\n<p>Utilisez Screaming Frog si vous souhaitez proc\u00e9der \u00e0 l'extraction de donn\u00e9es, qui consiste \u00e0 extraire les donn\u00e9es requises de votre site web. Les informations sont enregistr\u00e9es dans la m\u00e9moire de Screaming Frog, ce qui vous permet d'exporter les r\u00e9sultats de l'analyse vers Excel ou Google Sheets pour un examen plus approfondi. Pour des besoins plus avanc\u00e9s, vous pouvez incorporer des expressions r\u00e9guli\u00e8res afin de cibler et d'extraire avec pr\u00e9cision des mod\u00e8les sp\u00e9cifiques \u00e0 partir de votre contenu HTML ou JavaScript, y compris les n\u0153uds et les snippets.<\/p>\n\n\n\n<p>En int\u00e9grant ces techniques, vous pouvez optimiser votre strat\u00e9gie de r\u00e9f\u00e9rencement de mani\u00e8re efficace, en tirant parti de la puissance d'outils tels que Screaming Frog et m\u00eame en utilisant des technologies d'IA telles que ChatGPT pour obtenir des informations plus approfondies.<\/p>\n\n\n\n<p>1. Dans ScreamingFrog, allez dans <strong>Configuration &gt; Personnalis\u00e9e &gt; Extraction.<\/strong><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"529\" data-attachment-id=\"2448\" data-permalink=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/screamingfrog-extraction\/\" data-orig-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction.png\" data-orig-size=\"1378,712\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"screamingfrog-extraction\" data-image-description=\"\" data-image-caption=\"\" data-medium-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-300x155.png\" data-large-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-1024x529.png\" src=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-1024x529.png\" alt=\"Extraction personnalis\u00e9e Screaming Frog\" class=\"wp-image-2448 img-fluid\" srcset=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-1024x529.png 1024w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-300x155.png 300w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-768x397.png 768w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction-18x9.png 18w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screamingfrog-extraction.png 1378w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Extraction personnalis\u00e9e Screaming Frog<\/figcaption><\/figure>\n\n\n\n<p>2. Ensuite, vous devrez <strong>+Ajouter<\/strong> et configurez vos r\u00e8gles d'extraction.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"538\" data-attachment-id=\"2449\" data-permalink=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/custom-extraction-2\/\" data-orig-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction.png\" data-orig-size=\"1998,1050\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"custom-extraction\" data-image-description=\"\" data-image-caption=\"\" data-medium-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-300x158.png\" data-large-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-1024x538.png\" src=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-1024x538.png\" alt=\"Param\u00e8tres d&#039;extraction personnalis\u00e9s\" class=\"wp-image-2449 img-fluid\" srcset=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-1024x538.png 1024w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-300x158.png 300w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-768x404.png 768w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-1536x807.png 1536w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction-18x9.png 18w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/custom-extraction.png 1998w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">S\u00e9lectionner des \u00e9l\u00e9ments du HTML interne \u00e0 l'aide de l'onglet Extraction personnalis\u00e9e<\/figcaption><\/figure>\n\n\n\n<p>3. Ajoutez un <strong>Titre<\/strong>, <br>4. S\u00e9lectionnez si vous avez besoin de <strong>CSSPath, <a href=\"https:\/\/en.wikipedia.org\/wiki\/XPath\" target=\"_blank\" rel=\"noreferrer noopener\">XPath<span class=\"wpil-link-icon\" title=\"Le lien renvoie \u00e0 un site externe.\" style=\"margin: 0 0 0 5px;\"><svg width=\"24\" height=\"24\" style=\"height:16px; width:16px; fill:#000000; stroke:#000000; display:inline-block;\" viewbox=\"0 0 24 24\" version=\"1.1\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" xmlns:svg=\"http:\/\/www.w3.org\/2000\/svg\"><g id=\"wpil-svg-outbound-7-icon-path\" fill=\"none\" clip-path=\"url(#clip0_31_188)\">\r\n                            <path d=\"M9.16724 14.8891L20.1672 3.88908\" stroke-linecap=\"round\"\/>\r\n                            <path d=\"M13.4497 3.53554L20.5208 3.53554L20.5208 10.6066\" stroke-linecap=\"round\" stroke-linejoin=\"round\"\/>\r\n                            <path d=\"M17.5 13.5L17.5 16.26C17.5 17.4179 17.5 17.9968 17.2675 18.4359C17.0799 18.7902 16.7902 19.0799 16.4359 19.2675C15.9968 19.5 15.4179 19.5 14.26 19.5L7.74 19.5C6.58213 19.5 6.0032 19.5 5.56414 19.2675C5.20983 19.0799 4.92007 18.7902 4.73247 18.4359C4.5 17.9968 4.5 17.4179 4.5 16.26L4.5 9.74C4.5 8.58213 4.5 8.0032 4.73247 7.56414C4.92007 7.20983 5.20982 6.92007 5.56414 6.73247C6.0032 6.5 6.58213 6.5 7.74 6.5L11 6.5\" stroke-linecap=\"round\"\/>\r\n                        <\/g>\r\n                        <defs>\r\n                            <clippath id=\"clip0_31_188\">\r\n                                <rect fill=\"white\" height=\"24\" width=\"24\"\/>\r\n                            <\/clippath>\r\n                        <\/defs><\/svg><\/span><\/a>ou <a href=\"https:\/\/en.wikipedia.org\/wiki\/Regular_expression\" target=\"_blank\" rel=\"noreferrer noopener\">Regex<span class=\"wpil-link-icon\" title=\"Le lien renvoie \u00e0 un site externe.\" style=\"margin: 0 0 0 5px;\"><svg width=\"24\" height=\"24\" style=\"height:16px; width:16px; fill:#000000; stroke:#000000; display:inline-block;\" viewbox=\"0 0 24 24\" version=\"1.1\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" xmlns:svg=\"http:\/\/www.w3.org\/2000\/svg\"><use href=\"#wpil-svg-outbound-7-icon-path\"><\/use><\/svg><\/span><\/a><\/strong>, <br>5. Ajoutez votre <strong>fonction de recherche<\/strong>. <\/p>\n\n\n\n<p>Si vous n'\u00eates pas s\u00fbr du s\u00e9lecteur ou de la fonction dont vous avez besoin, regardez les exemples ci-dessous ou utilisez la fonction inspecter l'\u00e9l\u00e9ment dans la rubrique<a href=\"https:\/\/en.wikipedia.org\/wiki\/Web_development_tools\"> Outils de d\u00e9veloppement Google Chrome<\/a>. Vous pouvez ouvrir les outils de d\u00e9veloppement en cliquant avec le bouton droit de la souris dans le navigateur Google Chrome.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemple :<\/h3>\n\n\n\n<p>Voici un exemple de la fa\u00e7on de proc\u00e9der <a href=\"https:\/\/seonorth.ca\/ai\/block-content-scrapers\/\" data-wpil-monitor-id=\"34\">gratter<\/a> pour un identifiant de pixel Facebook<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"163\" data-attachment-id=\"2450\" data-permalink=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/facebook-id-extraction\/\" data-orig-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction.png\" data-orig-size=\"1544,246\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"facebook-id-extraction\" data-image-description=\"\" data-image-caption=\"\" data-medium-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-300x48.png\" data-large-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-1024x163.png\" src=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-1024x163.png\" alt=\"Extraction de l&#039;ID du pixel Facebook\" class=\"wp-image-2450 img-fluid\" srcset=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-1024x163.png 1024w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-300x48.png 300w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-768x122.png 768w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-1536x245.png 1536w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction-18x3.png 18w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-extraction.png 1544w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Extraction de l'ID du pixel Facebook<\/figcaption><\/figure>\n\n\n\n<p>Dans le <strong>R\u00e9sultats<\/strong>Comme vous pouvez le constater, il manque un pixel Facebook sur l'une de mes pages :<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"414\" data-attachment-id=\"2451\" data-permalink=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/facebook-id\/\" data-orig-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id.png\" data-orig-size=\"2166,876\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"facebook-id\" data-image-description=\"\" data-image-caption=\"\" data-medium-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-300x121.png\" data-large-file=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-1024x414.png\" src=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-1024x414.png\" alt=\"Identifiant Facebook manquant\" class=\"wp-image-2451 img-fluid\" srcset=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-1024x414.png 1024w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-300x121.png 300w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-768x311.png 768w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-1536x621.png 1536w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-2048x828.png 2048w, https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/facebook-id-18x7.png 18w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Identifiant Facebook manquant<\/figcaption><\/figure>\n\n\n\n<p>Vous trouverez ci-dessous des ensembles de donn\u00e9es d'extraction personnalis\u00e9s pr\u00e9d\u00e9finis pour vous aider \u00e0 d\u00e9marrer.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Syntaxe de base pour l'utilisation de XPath Web Scraping<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">SYNTAX<\/th><th scope=\"col\">FONCTION<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/<\/code><\/td><td>Rechercher n'importe o\u00f9 dans le document<\/td><\/tr><tr><td><code>\/<\/code><\/td><td>Cherchez dans la racine de la <a href=\"https:\/\/en.wikipedia.org\/wiki\/Website\" target=\"_blank\" rel=\"noreferrer noopener\">site web<span class=\"wpil-link-icon\" title=\"Le lien renvoie \u00e0 un site externe.\" style=\"margin: 0 0 0 5px;\"><svg width=\"24\" height=\"24\" style=\"height:16px; width:16px; fill:#000000; stroke:#000000; display:inline-block;\" viewbox=\"0 0 24 24\" version=\"1.1\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" xmlns:svg=\"http:\/\/www.w3.org\/2000\/svg\"><use href=\"#wpil-svg-outbound-7-icon-path\"><\/use><\/svg><\/span><\/a><\/td><\/tr><tr><td><code>@<\/code><\/td><td>S\u00e9lectionner un attribut sp\u00e9cifique d'un \u00e9l\u00e9ment<\/td><\/tr><tr><td><code>*<\/code><\/td><td>Le caract\u00e8re g\u00e9n\u00e9rique est utilis\u00e9 pour s\u00e9lectionner n'importe quel \u00e9l\u00e9ment<\/td><\/tr><tr><td><code>[ ]<\/code><\/td><td>Trouver un \u00e9l\u00e9ment sp\u00e9cifique<\/td><\/tr><tr><td><code>.<\/code><\/td><td>Sp\u00e9cifie l'\u00e9l\u00e9ment courant<\/td><\/tr><tr><td><code>..<\/code><\/td><td>Sp\u00e9cifie l'\u00e9l\u00e9ment parent<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>XPath<\/strong> fonctions<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/h1<\/code><\/td><td>Extraire toutes les balises H1<\/td><\/tr><tr><td><code>\/\/h2[1]<\/code><\/td><td>Extraire la premi\u00e8re balise H2<\/td><\/tr><tr><td><code>\/\/h2[2]<\/code><\/td><td>Extraire la deuxi\u00e8me balise H2<\/td><\/tr><tr><td><code>\/\/div\/p<\/code><\/td><td>Extrait tout &lt;p&gt; contenu dans un &lt;div&gt;<\/td><\/tr><tr><td><code>\/\/div[@class='auteur']<\/code><\/td><td>Extrait tout &lt;div&gt; avec la classe &quot;auteur&quot;.<\/td><\/tr><tr><td><code>\/\/p[@class='content']<\/code><\/td><td>Extrait tout &lt;p&gt; avec la classe &quot; contenu &quot;.<\/td><\/tr><tr><td><code>\/\/* [@class='content']<\/code><\/td><td>Extrait tout \u00e9l\u00e9ment avec la classe \"content\".<\/td><\/tr><tr><td><code>\/\/ul\/li[last()]<\/code><\/td><td>Extrait le dernier <li> d'un <ul>.<\/td><\/tr><tr><td><code>\/\/ol[@class='cat']\/li[1]<\/code><\/td><td>Extrait le premier <li>dans un <ol> avec la classe \"cat\".<\/td><\/tr><tr><td><code>compte(\/\/h2)<\/code><\/td><td>Compte le nombre de H2 (d\u00e9finir le filtre d'extraction sur \"Valeur de la fonction\").<\/td><\/tr><tr><td><code>\/\/a[contient(., 'en savoir plus')]<\/code><\/td><td>Extraire tout lien dont le texte d'ancrage contient \"en savoir plus\".<\/td><\/tr><tr><td><code>\/\/a[starts-with(@title, 'Written by')]<\/code><\/td><td>Extrait tout lien dont le titre commence par \"\u00c9crit par\".<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Comment extraire les \u00e9l\u00e9ments HTML courants<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/@href<\/code><\/td><td>Extraction de tous les liens<\/td><\/tr><tr><td><code>\/\/a[starts-with(@href, 'mailto')]\/@href<\/code><\/td><td>Extrait le lien qui commence par \"mailto :\" (adresse \u00e9lectronique)<\/td><\/tr><tr><td><code>\/\/a[starts-with(@href, 'tel')]\/@href<\/code><\/td><td>Extrait le lien qui commence par \"tel :\" (num\u00e9ro de t\u00e9l\u00e9phone)<\/td><\/tr><tr><td><code>\/\/img\/@src<\/code><\/td><td>Extraction de toutes les URL des sources d'images<\/td><\/tr><tr><td><code>\/\/img[contient(@class, 'aligncenter')]\/@src<\/code><\/td><td>Extrait toutes les URLs des sources d'images contenant le nom de classe \"aligncenter\".<\/td><\/tr><tr><td><code>\/\/lien[@rel='alternate']<\/code><\/td><td>Extrait les \u00e9l\u00e9ments dont l'attribut rel est d\u00e9fini sur \"alternate\".<\/td><\/tr><tr><td><code>\/\/@hreflang<\/code><\/td><td>Extraction de toutes les valeurs hreflang<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire les m\u00e9tabalises (utiliser l'\u00e9l\u00e9ment HTML interne)<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/meta[@property='article:published_time']\/@content<\/code><\/td><td>Extraction de la date de publication de l'article (balise m\u00e9ta fr\u00e9quemment trouv\u00e9e sur les sites Web WordPress).<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extrait de l'Open Graph<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/meta[@property='og:type']\/@content<\/code><\/td><td>Extrait l'objet de type Open Graph<\/td><\/tr><tr><td><code>\/\/meta[@property='og:image']\/@content<\/code><\/td><td>Extraction de l'URL de l'image vedette Open Graph<\/td><\/tr><tr><td><code>\/\/meta[@property='og:updated_time']\/@content<\/code><\/td><td>Extraction de l'heure de mise \u00e0 jour de l'Open Graph<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire des cartes Twitter<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/meta[@name='twitter:card']\/@content<\/code><\/td><td>Extrait le type de carte Twitter<\/td><\/tr><tr><td><code>\/\/meta[@name='twitter:title']\/@content<\/code><\/td><td>Extrait le titre de la carte Twitter<\/td><\/tr><tr><td><code>\/\/meta[@name='twitter:site']\/@content<\/code><\/td><td>Extrait l'objet du site de la carte Twitter (poign\u00e9e Twitter)<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire les types de sch\u00e9mas<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/*[@itemtype]\/@itemtype<\/code><\/td><td>Extraction de tous les types de balisage de sch\u00e9ma sur une page<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire le sch\u00e9ma du fil d'Ariane<\/h2>\n\n\n\n<p>Voici les extractions personnalis\u00e9es que vous utilisez pour v\u00e9rifier les breadcrumbs en <a href=\"https:\/\/seonorth.ca\/screaming-frog\/audit-canonicalized-urls\/\">Grenouille hurlante<\/a>.<\/p>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/*[contient(@itemtype, 'BreadcrumbList')]\/*[@itemprop]\/a\/@href<\/code><\/td><td>Extraire tous les liens du fil d'Ariane<\/td><\/tr><tr><td><code>\/\/*[contains(@itemtype, 'BreadcrumbList')]\/*[@itemprop][1]\/a\/@href<\/code><\/td><td>Extrait le premier lien du fil d'Ariane<\/td><\/tr><tr><td><code>\/\/*[contient(@itemtype, 'BreadcrumbList')]\/*[@itemprop]<\/code><\/td><td>Extraire les noms des fils d'Ariane (d\u00e9finir le filtre d'extraction \u00e0 \"Extraire le texte\")<\/td><\/tr><tr><td><code>count(\/\/*[contains(@itemtype, 'BreadcrumbList')]\/*[@itemprop])<\/code><\/td><td>Compte le nombre d'\u00e9l\u00e9ments de la liste de fil d'Ariane (d\u00e9finir le filtre d'extraction \u00e0 \"Valeur de la fonction\")<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire le sch\u00e9ma du produit<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/*[@itemprop='nom']\/@content<\/code><\/td><td>Extrait le nom du produit<\/td><\/tr><tr><td><code>\/\/*[@itemprop='description']\/@content<\/code><\/td><td>Extrait la description du produit<\/td><\/tr><tr><td><code>\/\/*[@itemprop='prix']\/@content<\/code><\/td><td>Extrait le prix du produit<\/td><\/tr><tr><td><code>\/\/*[@itemprop='priceCurrency']\/@content<\/code><\/td><td>Extraction de la devise du produit<\/td><\/tr><tr><td><code>\/\/*[@itemprop='disponibilit\u00e9']\/@href<\/code><\/td><td>Extrait la disponibilit\u00e9 des produits<\/td><\/tr><tr><td><code>\/\/*[@itemprop='sku']\/@content<\/code><\/td><td>Extraits du produit SKU<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extrait du sch\u00e9ma de r\u00e9vision<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/* [@itemprop='reviewCount']<\/code><\/td><td>Extraction du nombre de r\u00e9visions<\/td><\/tr><tr><td><code>\/\/* [@itemprop='ratingValue']<\/code><\/td><td>Extrait la valeur de la notation<\/td><\/tr><tr><td><code>\/\/* [@itemprop='bestRating']<\/code><\/td><td>Extraction de la meilleure note d'\u00e9valuation<\/td><\/tr><tr><td><code>\/\/*[@itemprop='review']\/*[@itemprop='name']<\/code><\/td><td>Extrait le nom de la revue<\/td><\/tr><tr><td><code>\/\/*[@itemprop='review']\/*[@itemprop='author']<\/code><\/td><td>Auteur de la revue Extraits<\/td><\/tr><tr><td><code>\/\/*[@itemprop='review']\/*[@itemprop='datePublished']\/@content<\/code><\/td><td>Extrait la date de publication des revues<\/td><\/tr><tr><td><code>\/\/*[@itemprop='review']\/*[@itemprop='reviewBody']<\/code><\/td><td>Extraire le contenu du corps des commentaires<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire le sch\u00e9ma des entreprises et organisations locales<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/*[contains(@itemtype, 'Organization')]\/*[@itemprop='name']<\/code><\/td><td>Extrait le nom de l'organisation<\/td><\/tr><tr><td><code>\/\/*[@itemprop='adresse']\/*[@itemprop='streetAddress']<\/code><\/td><td>Extrait l'adresse de la rue<\/td><\/tr><tr><td><code>\/\/*[@itemprop='address']\/*[@itemprop='addressLocality']<\/code><\/td><td>Extrait la localit\u00e9 de l'adresse<\/td><\/tr><tr><td><code>\/\/*[@itemprop='address']\/*[@itemprop='addressRegion']<\/code><\/td><td>Extrait la r\u00e9gion d'adresse<\/td><\/tr><tr><td><code>\/\/* [@itemprop='telephone']<\/code><\/td><td>Extrait le <a href=\"https:\/\/seonorth.ca\/link-to-call-a-phone-number\/\"  data-wpil-monitor-id=\"918\">num\u00e9ro de t\u00e9l\u00e9phone<\/a><\/td><\/tr><tr><td><code>\/\/*[@itemprop='sameAs']\/@href<\/code><\/td><td>Extraction des liens \"sameAs\".<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire le sch\u00e9ma de l'article<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">XPATH<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>\/\/*[contains(@itemtype, 'Article')]\/*[@itemprop='headline']<\/code><\/td><td>Extrait le titre de l'article<\/td><\/tr><tr><td><code>\/\/*[@itemprop='auteur']\/*[@itemprop='nom']\/@content<\/code><\/td><td>Extrait le nom de l'auteur<\/td><\/tr><tr><td><code>\/\/*[@itemprop='publisher']\/*[@itemprop='name']\/@content<\/code><\/td><td>Extrait le nom de l'\u00e9diteur<\/td><\/tr><tr><td><code>\/\/*[@itemprop='datePublished']\/@content<\/code><\/td><td>Extraits de la date de publication<\/td><\/tr><tr><td><code>\/\/*[@itemprop='dateModified']\/@content<\/code><\/td><td>Extrait la date de modification<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">Extraction de donn\u00e9es personnalis\u00e9es avec <strong>Regex<\/strong><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">Wildcards<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">SYNTAX<\/th><th scope=\"col\">FONCTION<\/th><\/tr><\/thead><tbody><tr><td><code>.<\/code><\/td><td>Correspond \u00e0 un caract\u00e8re quelconque<\/td><\/tr><tr><td><code>*<\/code><\/td><td>Faire correspondre le caract\u00e8re pr\u00e9c\u00e9dent 0 fois ou plus<\/td><\/tr><tr><td><code>?<\/code><\/td><td>Faire correspondre le caract\u00e8re pr\u00e9c\u00e9dent 0 ou 1 fois<\/td><\/tr><tr><td><code>+<\/code><\/td><td>Faire correspondre le caract\u00e8re pr\u00e9c\u00e9dent 1 ou plusieurs fois<\/td><\/tr><tr><td><code>|<\/code><\/td><td>OU<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Ancres<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">SYNTAX<\/th><th scope=\"col\">FONCTION<\/th><\/tr><\/thead><tbody><tr><td><code>^<\/code><\/td><td>La cha\u00eene de caract\u00e8res commence par le caract\u00e8re suivant.<\/td><\/tr><tr><td><code>$<\/code><\/td><td>La cha\u00eene de caract\u00e8res se termine par le caract\u00e8re pr\u00e9c\u00e9dent.<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Groupes<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">SYNTAX<\/th><th scope=\"col\">FONCTION<\/th><\/tr><\/thead><tbody><tr><td><code>( )<\/code><\/td><td>Faire correspondre les caract\u00e8res joints dans l'ordre exact<\/td><\/tr><tr><td><code>[ ]<\/code><\/td><td>Faire correspondre les caract\u00e8res joints dans n'importe quel ordre<\/td><\/tr><tr><td><code>-<\/code><\/td><td>Correspond \u00e0 tous les caract\u00e8res dans la plage sp\u00e9cifi\u00e9e<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Escape<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">SYNTAX<\/th><th scope=\"col\">FONCTION<\/th><\/tr><\/thead><tbody><tr><td><code>\\<\/code><\/td><td>Traite le caract\u00e8re litt\u00e9ralement, pas comme une regex.<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraction de donn\u00e9es personnalis\u00e9e Regex<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"'](UA-.* ?)[\"']<\/code><\/td><td>Extraire l'ID de suivi de Google Analytics<\/td><\/tr><tr><td><code>[\"'](G-.* ?)[\"']<\/code><\/td><td>Extraire l'ID de suivi de Google Analytics 4 (GA4)<\/td><\/tr><tr><td><code>[\"' \"](AW-.* ?) [\"' \"]<\/code><\/td><td>Extraire l'ID de conversion Google Ads et\/ou le tag de remarketing<\/td><\/tr><tr><td><code>[\"'](GTM-.* ?)[\"']<\/code><\/td><td>Extraire l'ID de Google Tag Manager et\/ou de Google Optimize<\/td><\/tr><tr><td><code>fbq\\([\"']init[\"'], [\"'](.*?)[\"']<\/code><\/td><td>Extraire l'ID du pixel Facebook<\/td><\/tr><tr><td><code>\\{ti :[\"'](.* ?)[\"']\\}<\/code><\/td><td>Extraire la balise UET de Bing Ads<\/td><\/tr><tr><td><code>adroll_adv_id = [\"'](.* ?) [\"']<\/code><\/td><td>Extraire l'ID de l'annonceur AdRoll<\/td><\/tr><tr><td><code>adroll_pix_id = [\"'](.* ?) [\"']<\/code><\/td><td>Extraire l'ID du pixel AdRoll<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Extraire tout le balisage de sch\u00e9ma et les types de sch\u00e9ma<\/h2>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"']application\/ld\\+json[\"']&gt;(.* ?)<\/code><\/td><td>Extraction de toutes les balises du sch\u00e9ma JSON-LD.<\/td><\/tr><tr><td><code>[\"']@type[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait tous les types de balises de sch\u00e9ma JSON-LD d'une page.<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Extraire le sch\u00e9ma du fil d'Ariane<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"']item[\"'] : *[\"']@id[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extraction des liens du fil d'Ariane<\/td><\/tr><tr><td><code>[\"']item[\"'] : *[\"']@id[\"'] : *[\"'].* ?[\"'], *[\"']nom[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extraction des noms de fil d'Ariane<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Extraire le sch\u00e9ma du produit<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"']@type[\"'] : *[\"']Product[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait le nom du produit<\/td><\/tr><tr><td><code>[\"']@type[\"'] : *[\"']Product[\"'].*?[\"']description[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait la description du produit<\/td><\/tr><tr><td><code>[\"']@type[\"'] : *[\"']Product[\"'].*?[\"']price[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait le prix du produit<\/td><\/tr><tr><td><code>[\"']@type[\"'] : *[\"']Product[\"'].*?[\"']priceCurrency[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extraction de la devise du produit<\/td><\/tr><tr><td><code>[\"']@type[\"'] : *[\"']Product[\"'].*?[\"']availability[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait la disponibilit\u00e9 des produits<\/td><\/tr><tr><td><code>[\"']@type[\"'] : *[\"']Product[\"'].*?[\"']sku[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extraits du produit SKU<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Extrait du sch\u00e9ma de r\u00e9vision<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"']reviewCount[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extraction du nombre de r\u00e9visions<\/td><\/tr><tr><td><code>[\"']ratingValue[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait la valeur de la notation<\/td><\/tr><tr><td><code>[\"']bestRating[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extraire la meilleure note<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Extraire le sch\u00e9ma des entreprises et organisations locales<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"']@type[\"'] : *[\"']Organization[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait le nom de l'organisation<\/td><\/tr><tr><td><code>[\"']streetAddress[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait l'adresse de la rue<\/td><\/tr><tr><td><code>[\"']addressLocality[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait la localit\u00e9 de l'adresse<\/td><\/tr><tr><td><code>[\"']addressRegion[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait la r\u00e9gion d'adresse<\/td><\/tr><tr><td><code>[\"']t\u00e9l\u00e9phone[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait le num\u00e9ro de t\u00e9l\u00e9phone<\/td><\/tr><tr><td><code>[\"']sameAs[\"'] : *\\[(.* ?)\\]<\/code><\/td><td>Extraction des liens \"sameAs\".<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Extraire le sch\u00e9ma d'un article ou d'un billet de blog<\/h3>\n\n\n\n<figure class=\"wp-block-table is-style-stripes\"><table class=\"has-fixed-layout\"><thead><tr><th scope=\"col\">REGEX<\/th><th scope=\"col\">SORTIE<\/th><\/tr><\/thead><tbody><tr><td><code>[\"']headline[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait du titre de l'article<\/td><\/tr><tr><td><code>[\"']author[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait le nom de l'auteur<\/td><\/tr><tr><td><code>[\"']publisher[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait le nom de l'\u00e9diteur<\/td><\/tr><tr><td><code>[\"']datePublished[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extraits de la date de publication<\/td><\/tr><tr><td><code>[\"']dateModified[\"'] : *[\"'](.* ?)[\"']<\/code><\/td><td>Extrait la date de modification<\/td><\/tr><\/tbody><tfoot><tr><td><\/td><td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n<p>Les possibilit\u00e9s sont infinies ; n'h\u00e9sitez pas \u00e0 me faire savoir si vous souhaitez que des extractions soient ajout\u00e9es \u00e0 cette liste.<\/p>\n\n\n<script>\nvar gform;gform||(document.addEventListener(\"gform_main_scripts_loaded\",function(){gform.scriptsLoaded=!0}),document.addEventListener(\"gform\/theme\/scripts_loaded\",function(){gform.themeScriptsLoaded=!0}),window.addEventListener(\"DOMContentLoaded\",function(){gform.domLoaded=!0}),gform={domLoaded:!1,scriptsLoaded:!1,themeScriptsLoaded:!1,isFormEditor:()=>\"function\"==typeof InitializeEditor,callIfLoaded:function(o){return!(!gform.domLoaded||!gform.scriptsLoaded||!gform.themeScriptsLoaded&&!gform.isFormEditor()||(gform.isFormEditor()&&console.warn(\"The use of gform.initializeOnLoaded() is deprecated in the form editor context and will be removed in Gravity Forms 3.1.\"),o(),0))},initializeOnLoaded:function(o){gform.callIfLoaded(o)||(document.addEventListener(\"gform_main_scripts_loaded\",()=>{gform.scriptsLoaded=!0,gform.callIfLoaded(o)}),document.addEventListener(\"gform\/theme\/scripts_loaded\",()=>{gform.themeScriptsLoaded=!0,gform.callIfLoaded(o)}),window.addEventListener(\"DOMContentLoaded\",()=>{gform.domLoaded=!0,gform.callIfLoaded(o)}))},hooks:{action:{},filter:{}},addAction:function(o,r,e,t){gform.addHook(\"action\",o,r,e,t)},addFilter:function(o,r,e,t){gform.addHook(\"filter\",o,r,e,t)},doAction:function(o){gform.doHook(\"action\",o,arguments)},applyFilters:function(o){return gform.doHook(\"filter\",o,arguments)},removeAction:function(o,r){gform.removeHook(\"action\",o,r)},removeFilter:function(o,r,e){gform.removeHook(\"filter\",o,r,e)},addHook:function(o,r,e,t,n){null==gform.hooks[o][r]&&(gform.hooks[o][r]=[]);var d=gform.hooks[o][r];null==n&&(n=r+\"_\"+d.length),gform.hooks[o][r].push({tag:n,callable:e,priority:t=null==t?10:t})},doHook:function(r,o,e){var t;if(e=Array.prototype.slice.call(e,1),null!=gform.hooks[r][o]&&((o=gform.hooks[r][o]).sort(function(o,r){return o.priority-r.priority}),o.forEach(function(o){\"function\"!=typeof(t=o.callable)&&(t=window[t]),\"action\"==r?t.apply(null,e):e[0]=t.apply(null,e)})),\"filter\"==r)return e[0]},removeHook:function(o,r,t,n){var e;null!=gform.hooks[o][r]&&(e=(e=gform.hooks[o][r]).filter(function(o,r,e){return!!(null!=n&&n!=o.tag||null!=t&&t!=o.priority)}),gform.hooks[o][r]=e)}});\n<\/script>\n\n                <div class='gf_browser_gecko gform_wrapper gform_legacy_markup_wrapper gform-theme--no-framework' data-form-theme='legacy' data-form-index='0' id='gform_wrapper_4' style='display:none'><div id='gf_4' class='gform_anchor' tabindex='-1'><\/div><form method='post' enctype='multipart\/form-data'  id='gform_4'  action='\/fr\/wp-json\/wp\/v2\/pages\/2446#gf_4' data-formid='4' novalidate data-trp-original-action=\"\/fr\/wp-json\/wp\/v2\/pages\/2446#gf_4\">\n                        <div class='gform-body gform_body'><ul id='gform_fields_4' class='gform_fields top_label form_sublabel_below description_below validation_below'><li id=\"field_4_18\" class=\"gfield gfield--type-section gsection field_sublabel_below gfield--has-description field_description_below field_validation_below gfield_visibility_visible\"  ><h2 class=\"gsection_title\">Cet article a-t-il r\u00e9pondu \u00e0 vos questions ?<\/h2><div class='gsection_description' id='gfield_description_4_18'>Aidez-nous \u00e0 am\u00e9liorer notre contenu.<\/div><\/li><li id=\"field_4_17\" class=\"gfield gfield--type-survey gfield--type-choice gfield--input-type-radio gf_list_inline gfield_contains_required field_sublabel_below gfield--no-description field_description_below hidden_label field_validation_below gfield_visibility_visible gsurvey-survey-field\"  data-field-class=\"gsurvey-survey-field\" ><label class='gfield_label gform-field-label' >Enqu\u00eate utile<span class=\"gfield_required\"><span class=\"gfield_required gfield_required_asterisk\">*<\/span><\/span><\/label><div class='ginput_container ginput_container_radio'><ul class='gfield_radio' id='input_4_17'>\n\t\t\t<li class='gchoice gchoice_4_17_0'>\n\t\t\t\t<input name='input_17' type='radio' value='gsurvey17c162eb0f'  id='choice_4_17_0'    \/>\n\t\t\t\t<label for='choice_4_17_0' id='label_4_17_0' class='gform-field-label gform-field-label--type-inline'>Oui<\/label>\n\t\t\t<\/li>\n\t\t\t<li class='gchoice gchoice_4_17_1'>\n\t\t\t\t<input name='input_17' type='radio' value='gsurvey1760f09eae'  id='choice_4_17_1'    \/>\n\t\t\t\t<label for='choice_4_17_1' id='label_4_17_1' class='gform-field-label gform-field-label--type-inline'>Non<\/label>\n\t\t\t<\/li><\/ul><\/div><\/li><li id=\"field_4_6\" class=\"gfield gfield--type-textarea field_sublabel_below gfield--no-description field_description_below field_validation_below gfield_visibility_visible\"  ><label class='gfield_label gform-field-label' for='input_4_6'>Comment pouvons-nous l'am\u00e9liorer ?<\/label><div class='ginput_container ginput_container_textarea'><textarea name='input_6' id='input_4_6' class='textarea medium'    placeholder='Ce formulaire est anonyme, et aucune r\u00e9ponse ne sera fournie. Si votre probl\u00e8me n\u00e9cessite une r\u00e9ponse, veuillez utiliser le lien &#039;contact support&amp;#039 ; ci-dessous.'  aria-invalid=\"false\"   rows='10' cols='50'><\/textarea><\/div><\/li><li id=\"field_4_7\" class=\"gfield gfield--type-html gfield_html gfield_html_formatted gfield_no_follows_desc field_sublabel_below gfield--no-description field_description_below field_validation_below gfield_visibility_visible\"  ><a href=\"mailto:isaac@seonorth.ca?subject=Support\">Contact Support<\/a><\/li><li id=\"field_4_19\" class=\"gfield gfield--type-hidden gform_hidden field_sublabel_below gfield--no-description field_description_below field_validation_below gfield_visibility_visible\"  ><div class='ginput_container ginput_container_text'><input name='input_19' id='input_4_19' type='hidden' class='gform_hidden'  aria-invalid=\"false\" value='' \/><\/div><\/li><li id=\"field_4_20\" class=\"gfield gfield--type-honeypot gform_validation_container field_sublabel_below gfield--has-description field_description_below field_validation_below gfield_visibility_visible\"  ><label class='gfield_label gform-field-label' for='input_4_20'>Nom<\/label><div class='ginput_container'><input name='input_20' id='input_4_20' type='text' value='' autocomplete='new-password'\/><\/div><div class='gfield_description' id='gfield_description_4_20'>Ce champ n'est utilis\u00e9 qu'\u00e0 des fins de validation et devrait rester inchang\u00e9.<\/div><\/li><\/ul><\/div>\n        <div class='gform-footer gform_footer top_label'> <input type='submit' id='gform_submit_button_4' class='gform_button button' onclick='gform.submission.handleButtonClick(this);' data-submission-type='submit' value='Envoyer \u00e0 Isaac'  \/> \n            <input type='hidden' class='gform_hidden' name='gform_submission_method' data-js='gform_submission_method_4' value='postback' \/>\n            <input type='hidden' class='gform_hidden' name='gform_theme' data-js='gform_theme_4' id='gform_theme_4' value='legacy' \/>\n            <input type='hidden' class='gform_hidden' name='gform_style_settings' data-js='gform_style_settings_4' id='gform_style_settings_4' value='{&quot;inputPrimaryColor&quot;:&quot;#204ce5&quot;}' \/>\n            <input type='hidden' class='gform_hidden' name='is_submit_4' value='1' \/>\n            <input type='hidden' class='gform_hidden' name='gform_submit' value='4' \/>\n            \n            <input type='hidden' class='gform_hidden' name='gform_unique_id' value='' \/>\n            <input type='hidden' class='gform_hidden' name='state_4' value='WyJbXSIsIjViZjgwM2M0NzgxODNjZmJlOGJhMjlmZjRhNzc5YTg5Il0=' \/>\n            <input type='hidden' autocomplete='off' class='gform_hidden' name='gform_target_page_number_4' id='gform_target_page_number_4' value='0' \/>\n            <input type='hidden' autocomplete='off' class='gform_hidden' name='gform_source_page_number_4' id='gform_source_page_number_4' value='1' \/>\n            <input type='hidden' name='gform_field_values' value='' \/>\n            \n        <\/div>\n                        <input type=\"hidden\" name=\"trp-form-language\" value=\"fr\"\/><\/form>\n                        <\/div><script>\ngform.initializeOnLoaded( function() {gformInitSpinner( 4, 'https:\/\/seonorth.ca\/wp-content\/plugins\/gravityforms\/images\/spinner.svg', true );jQuery('#gform_ajax_frame_4').on('load',function(){var contents = jQuery(this).contents().find('*').html();var is_postback = contents.indexOf('GF_AJAX_POSTBACK') >= 0;if(!is_postback){return;}var form_content = jQuery(this).contents().find('#gform_wrapper_4');var is_confirmation = jQuery(this).contents().find('#gform_confirmation_wrapper_4').length > 0;var is_redirect = contents.indexOf('gformRedirect(){') >= 0;var is_form = form_content.length > 0 && ! is_redirect && ! is_confirmation;var mt = parseInt(jQuery('html').css('margin-top'), 10) + parseInt(jQuery('body').css('margin-top'), 10) + 100;if(is_form){form_content.find('form').css('opacity', 0);jQuery('#gform_wrapper_4').html(form_content.html());if(form_content.hasClass('gform_validation_error')){jQuery('#gform_wrapper_4').addClass('gform_validation_error');} else {jQuery('#gform_wrapper_4').removeClass('gform_validation_error');}setTimeout( function() { \/* delay the scroll by 50 milliseconds to fix a bug in chrome *\/ jQuery(document).scrollTop(jQuery('#gform_wrapper_4').offset().top - mt); }, 50 );if(window['gformInitDatepicker']) {gformInitDatepicker();}if(window['gformInitPriceFields']) {gformInitPriceFields();}var current_page = jQuery('#gform_source_page_number_4').val();gformInitSpinner( 4, 'https:\/\/seonorth.ca\/wp-content\/plugins\/gravityforms\/images\/spinner.svg', true );jQuery(document).trigger('gform_page_loaded', [4, current_page]);window['gf_submitting_4'] = false;}else if(!is_redirect){var confirmation_content = jQuery(this).contents().find('.GF_AJAX_POSTBACK').html();if(!confirmation_content){confirmation_content = contents;}jQuery('#gform_wrapper_4').replaceWith(confirmation_content);jQuery(document).scrollTop(jQuery('#gf_4').offset().top - mt);jQuery(document).trigger('gform_confirmation_loaded', [4]);window['gf_submitting_4'] = false;wp.a11y.speak(jQuery('#gform_confirmation_message_4').text());}else{jQuery('#gform_4').append(contents);if(window['gformRedirect']) {gformRedirect();}}jQuery(document).trigger(\"gform_pre_post_render\", [{ formId: \"4\", currentPage: \"current_page\", abort: function() { this.preventDefault(); } }]);                if (event && event.defaultPrevented) {                return;         }        const gformWrapperDiv = document.getElementById( \"gform_wrapper_4\" );        if ( gformWrapperDiv ) {            const visibilitySpan = document.createElement( \"span\" );            visibilitySpan.id = \"gform_visibility_test_4\";            gformWrapperDiv.insertAdjacentElement( \"afterend\", visibilitySpan );        }        const visibilityTestDiv = document.getElementById( \"gform_visibility_test_4\" );        let postRenderFired = false;                function triggerPostRender() {            if ( postRenderFired ) {                return;            }            postRenderFired = true;            gform.core.triggerPostRenderEvents( 4, current_page );            if ( visibilityTestDiv ) {                visibilityTestDiv.parentNode.removeChild( visibilityTestDiv );            }        }        function debounce( func, wait, immediate ) {            var timeout;            return function() {                var context = this, args = arguments;                var later = function() {                    timeout = null;                    if ( !immediate ) func.apply( context, args );                };                var callNow = immediate && !timeout;                clearTimeout( timeout );                timeout = setTimeout( later, wait );                if ( callNow ) func.apply( context, args );            };        }        const debouncedTriggerPostRender = debounce( function() {            triggerPostRender();        }, 200 );        if ( visibilityTestDiv && visibilityTestDiv.offsetParent === null ) {            const observer = new MutationObserver( ( mutations ) => {                mutations.forEach( ( mutation ) => {                    if ( mutation.type === 'attributes' && visibilityTestDiv.offsetParent !== null ) {                        debouncedTriggerPostRender();                        observer.disconnect();                    }                });            });            observer.observe( document.body, {                attributes: true,                childList: false,                subtree: true,                attributeFilter: [ 'style', 'class' ],            });        } else {            triggerPostRender();        }    } );} );\n<\/script>","protected":false},"excerpt":{"rendered":"<p>Screaming Frog (screamingfrog.co.uk) est un outil de r\u00e9f\u00e9rencement puissant qui offre de nombreuses fonctionnalit\u00e9s d'optimisation pour les moteurs de recherche, notamment les extractions personnalis\u00e9es, qui vous permettent d'extraire facilement des donn\u00e9es de vos crawls. Cet article de blog traite du fonctionnement de l'extraction personnalis\u00e9e de Screaming Frog et des raisons pour lesquelles elle peut vous aider \u00e0 am\u00e9liorer vos efforts de r\u00e9f\u00e9rencement, votre marketing num\u00e9rique et vos strat\u00e9gies d'indexation. Les sites Web ont... <a class=\"moretag\" href=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/\"> Lire l'article complet <\/a><\/p>","protected":false},"author":1,"featured_media":2452,"parent":2423,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-2446","page","type-page","status-publish","has-post-thumbnail","hentry"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.3.1 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Screaming Frog Custom Extractions: A Guide to Extracting Crawl Data - A Custom Extraction Cheat Sheet<\/title>\n<meta name=\"description\" content=\"Screaming Frog (screamingfrog.co.uk) is a powerful SEO tool with many search engine optimization features, including custom extractions, which allow you\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Screaming Frog Custom Extractions: A Guide to Extracting Crawl Data - A Custom Extraction Cheat Sheet\" \/>\n<meta property=\"og:description\" content=\"Screaming Frog (screamingfrog.co.uk) is a powerful SEO tool with many search engine optimization features, including custom extractions, which allow you\" \/>\n<meta property=\"og:url\" content=\"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/\" \/>\n<meta property=\"og:site_name\" content=\"SEO North\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/se0n0rth\" \/>\n<meta property=\"article:modified_time\" content=\"2025-02-15T21:17:48+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1600\" \/>\n\t<meta property=\"og:image:height\" content=\"1067\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@north_seo\" \/>\n<meta name=\"twitter:label1\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data1\" content=\"7 minutes\" \/>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Screaming Frog Custom Extractions: A Guide to Extracting Crawl Data - A Custom Extraction Cheat Sheet","description":"Screaming Frog (screamingfrog.co.uk) is a powerful SEO tool with many search engine optimization features, including custom extractions, which allow you","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/","og_locale":"fr_FR","og_type":"article","og_title":"Screaming Frog Custom Extractions: A Guide to Extracting Crawl Data - A Custom Extraction Cheat Sheet","og_description":"Screaming Frog (screamingfrog.co.uk) is a powerful SEO tool with many search engine optimization features, including custom extractions, which allow you","og_url":"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/","og_site_name":"SEO North","article_publisher":"https:\/\/www.facebook.com\/se0n0rth","article_modified_time":"2025-02-15T21:17:48+00:00","og_image":[{"width":1600,"height":1067,"url":"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg","type":"image\/jpeg"}],"twitter_card":"summary_large_image","twitter_site":"@north_seo","twitter_misc":{"Dur\u00e9e de lecture estim\u00e9e":"7 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/","url":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/","name":"Screaming Frog Custom Extractions: A Guide to Extracting Crawl Data - A Custom Extraction Cheat Sheet","isPartOf":{"@id":"https:\/\/seonorth.ca\/#website"},"primaryImageOfPage":{"@id":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/#primaryimage"},"image":{"@id":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/#primaryimage"},"thumbnailUrl":"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg","datePublished":"2021-03-10T17:52:12+00:00","dateModified":"2025-02-15T21:17:48+00:00","description":"Screaming Frog (screamingfrog.co.uk) is a powerful SEO tool with many search engine optimization features, including custom extractions, which allow you","breadcrumb":{"@id":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/#primaryimage","url":"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg","contentUrl":"https:\/\/seonorth.ca\/wp-content\/uploads\/2021\/03\/screaming-frog-custom-extractions.jpg","width":1600,"height":1067},{"@type":"BreadcrumbList","@id":"https:\/\/seonorth.ca\/screaming-frog\/custom-extraction\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/seonorth.ca\/"},{"@type":"ListItem","position":2,"name":"Screaming Frog","item":"https:\/\/seonorth.ca\/screaming-frog\/"},{"@type":"ListItem","position":3,"name":"Screaming Frog Custom Extractions: A Guide to Extracting Crawl Data"}]},{"@type":"WebSite","@id":"https:\/\/seonorth.ca\/#website","url":"https:\/\/seonorth.ca\/","name":"SEO North","description":"Making the internet a better place.","publisher":{"@id":"https:\/\/seonorth.ca\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/seonorth.ca\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/seonorth.ca\/#organization","name":"SEO North","url":"https:\/\/seonorth.ca\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/seonorth.ca\/#\/schema\/logo\/image\/","url":"https:\/\/seonorth.ca\/wp-content\/uploads\/2020\/09\/Keyword-Research.jpg","contentUrl":"https:\/\/seonorth.ca\/wp-content\/uploads\/2020\/09\/Keyword-Research.jpg","width":1600,"height":960,"caption":"SEO North"},"image":{"@id":"https:\/\/seonorth.ca\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/se0n0rth","https:\/\/x.com\/north_seo","https:\/\/www.instagram.com\/seo.north\/","https:\/\/www.linkedin.com\/company\/seo-north\/","https:\/\/www.youtube.com\/c\/SEONorth"]}]}},"jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/pages\/2446","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/comments?post=2446"}],"version-history":[{"count":21,"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/pages\/2446\/revisions"}],"predecessor-version":[{"id":17797,"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/pages\/2446\/revisions\/17797"}],"up":[{"embeddable":true,"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/pages\/2423"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/media\/2452"}],"wp:attachment":[{"href":"https:\/\/seonorth.ca\/fr\/wp-json\/wp\/v2\/media?parent=2446"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}