{"id":2446,"date":"2021-03-10T17:52:12","date_gmt":"2021-03-10T17:52:12","guid":{"rendered":"https:\/\/seonorth.ca\/?page_id=2446"},"modified":"2025-02-15T21:17:48","modified_gmt":"2025-02-15T21:17:48","slug":"custom-extraction","status":"publish","type":"page","link":"https:\/\/seonorth.ca\/fr\/screaming-frog\/custom-extraction\/","title":{"rendered":"Screaming Frog Custom Extractions : Un guide pour l'extraction des donn\u00e9es de crawl"},"content":{"rendered":"

Screaming Frog (screamingfrog.co.uk) est un outil de r\u00e9f\u00e9rencement puissant qui offre de nombreuses fonctionnalit\u00e9s d'optimisation pour les moteurs de recherche, notamment les extractions personnalis\u00e9es, qui vous permettent d'extraire facilement des donn\u00e9es de vos crawls. Cet article de blog explique comment fonctionne l'extraction personnalis\u00e9e de Screaming Frog et pourquoi elle peut vous aider \u00e0 am\u00e9liorer vos efforts de r\u00e9f\u00e9rencement, votre marketing num\u00e9rique de commerce \u00e9lectronique et vos strat\u00e9gies d'indexation.<\/p>\n\n\n\n

\"Extraction<\/figure>\n\n\n\n

Les sites Web contiennent une tonne d'informations utiles. La plupart du temps, il est trop laborieux ou compliqu\u00e9 de visiter chaque page d'un site Web pour copier les donn\u00e9es produit, les m\u00e9tadonn\u00e9es, les balises de titre et le texte d'ancrage dans une feuille de calcul. C'est l\u00e0 que Screaming Frog vient \u00e0 la rescousse avec des extractions de donn\u00e9es de recherche personnalis\u00e9es, en utilisant des API et des expressions r\u00e9guli\u00e8res pour automatiser le processus. Les extractions personnalis\u00e9es sont une forme de web scraping, de web harvesting ou d'extraction de donn\u00e9es web utilis\u00e9e pour r\u00e9cup\u00e9rer et extraire des donn\u00e9es de sites web, ce qui vous permet de les stocker localement sur votre ordinateur.<\/p>\n\n\n\n

Pour les d\u00e9butants, quelques questions que vous pourriez vous poser :<\/p>\n\n\n\n

Quel est le <\/strong>Screaming Frog SEO Spider<\/strong>?<\/strong><\/h2>\n\n\n\n

Le logiciel Screaming Frog SEO Spider est un robot d'exploration de sites web qui am\u00e9liore le r\u00e9f\u00e9rencement sur site en extrayant et en analysant les donn\u00e9es structur\u00e9es de votre site web \u00e0 l'aide d'une interface utilisateur graphique (GUI), en g\u00e9rant efficacement les contenus XML et JavaScript.<\/p>\n\n\n\n

Quels sont les <\/strong>extractions sur mesure<\/strong>?<\/strong><\/h2>\n\n\n\n

Les extractions personnalis\u00e9es sont des fonctions de l'araign\u00e9e SEO de Screaming Frog qui permettent d'extraire des informations explicites des pages Web. Ces extractions aident \u00e0 optimiser votre site pour un audit SEO technique, y compris les r\u00e9sultats de recherche, en recueillant des donn\u00e9es essentielles sur votre copie, et en aidant \u00e0 localiser et \u00e0 corriger les erreurs dans les en-t\u00eates et d'autres \u00e9l\u00e9ments.<\/p>\n\n\n\n

Comment se fait l'extraction des donn\u00e9es ?<\/strong><\/h2>\n\n\n\n

Utilisez Screaming Frog si vous souhaitez proc\u00e9der \u00e0 l'extraction de donn\u00e9es, qui consiste \u00e0 extraire les donn\u00e9es requises de votre site web. Les informations sont enregistr\u00e9es dans la m\u00e9moire de Screaming Frog, ce qui vous permet d'exporter les r\u00e9sultats de l'analyse vers Excel ou Google Sheets pour un examen plus approfondi. Il peut s'agir de donn\u00e9es provenant de menus d\u00e9roulants et de structures de liens internes.<\/p>\n\n\n\n

Pourquoi l'extraction de donn\u00e9es est-elle essentielle ?<\/strong><\/h2>\n\n\n\n

L'extraction de donn\u00e9es vous permet de r\u00e9colter de grandes quantit\u00e9s de donn\u00e9es rapidement et efficacement. Cette automatisation vous donne des r\u00e9sultats imm\u00e9diats sur l'architecture web. Ce processus vous permet d'\u00e9conomiser du temps et des ressources tout en vous fournissant les donn\u00e9es pr\u00e9cieuses dont vous avez besoin pour planifier et \u00e9laborer des strat\u00e9gies d'optimisation pour les moteurs de recherche. Screaming Frog est l'outil de scraper Web le plus utilis\u00e9 par les r\u00e9f\u00e9renceurs et un extracteur de donn\u00e9es. Les options sont infinies ; il y a une tonne de syntaxes de web-scraping personnalis\u00e9es. Consultez le tutoriel ci-dessous.<\/p>\n\n\n\n

Comment extraire des donn\u00e9es personnalis\u00e9es avec Screaming Frog ?<\/h2>\n\n\n\n

Utilisez Screaming Frog si vous souhaitez proc\u00e9der \u00e0 l'extraction de donn\u00e9es, qui consiste \u00e0 extraire les donn\u00e9es requises de votre site web. Les informations sont enregistr\u00e9es dans la m\u00e9moire de Screaming Frog, ce qui vous permet d'exporter les r\u00e9sultats de l'analyse vers Excel ou Google Sheets pour un examen plus approfondi. Pour des besoins plus avanc\u00e9s, vous pouvez incorporer des expressions r\u00e9guli\u00e8res afin de cibler et d'extraire avec pr\u00e9cision des mod\u00e8les sp\u00e9cifiques \u00e0 partir de votre contenu HTML ou JavaScript, y compris les n\u0153uds et les snippets.<\/p>\n\n\n\n

En int\u00e9grant ces techniques, vous pouvez optimiser votre strat\u00e9gie de r\u00e9f\u00e9rencement de mani\u00e8re efficace, en tirant parti de la puissance d'outils tels que Screaming Frog et m\u00eame en utilisant des technologies d'IA telles que ChatGPT pour obtenir des informations plus approfondies.<\/p>\n\n\n\n

1. Dans ScreamingFrog, allez dans Configuration > Personnalis\u00e9e > Extraction.<\/strong><\/p>\n\n\n\n

\"Extraction
Extraction personnalis\u00e9e Screaming Frog<\/figcaption><\/figure>\n\n\n\n

2. Ensuite, vous devrez +Ajouter<\/strong> et configurez vos r\u00e8gles d'extraction.<\/p>\n\n\n\n

\"Param\u00e8tres
S\u00e9lectionner des \u00e9l\u00e9ments du HTML interne \u00e0 l'aide de l'onglet Extraction personnalis\u00e9e<\/figcaption><\/figure>\n\n\n\n

3. Ajoutez un Titre<\/strong>,
4. S\u00e9lectionnez si vous avez besoin de CSSPath, XPath\r\n \r\n \r\n \r\n <\/g>\r\n \r\n \r\n \r\n <\/clippath>\r\n <\/defs><\/svg><\/span><\/a>ou Regex<\/use><\/svg><\/span><\/a><\/strong>,
5. Ajoutez votre fonction de recherche<\/strong>. <\/p>\n\n\n\n

Si vous n'\u00eates pas s\u00fbr du s\u00e9lecteur ou de la fonction dont vous avez besoin, regardez les exemples ci-dessous ou utilisez la fonction inspecter l'\u00e9l\u00e9ment dans la rubrique Outils de d\u00e9veloppement Google Chrome<\/a>. Vous pouvez ouvrir les outils de d\u00e9veloppement en cliquant avec le bouton droit de la souris dans le navigateur Google Chrome.<\/p>\n\n\n\n

Exemple :<\/h3>\n\n\n\n

Voici un exemple de la fa\u00e7on de proc\u00e9der gratter<\/a> pour un identifiant de pixel Facebook<\/p>\n\n\n\n

\"Extraction
Extraction de l'ID du pixel Facebook<\/figcaption><\/figure>\n\n\n\n

Dans le R\u00e9sultats<\/strong>Comme vous pouvez le constater, il manque un pixel Facebook sur l'une de mes pages :<\/p>\n\n\n\n

\"Identifiant
Identifiant Facebook manquant<\/figcaption><\/figure>\n\n\n\n

Vous trouverez ci-dessous des ensembles de donn\u00e9es d'extraction personnalis\u00e9s pr\u00e9d\u00e9finis pour vous aider \u00e0 d\u00e9marrer.<\/p>\n\n\n\n

Syntaxe de base pour l'utilisation de XPath Web Scraping<\/h2>\n\n\n\n
SYNTAX<\/th>FONCTION<\/th><\/tr><\/thead>
\/\/<\/code><\/td>Rechercher n'importe o\u00f9 dans le document<\/td><\/tr>
\/<\/code><\/td>Cherchez dans la racine de la site web<\/use><\/svg><\/span><\/a><\/td><\/tr>
@<\/code><\/td>
S\u00e9lectionner un attribut sp\u00e9cifique d'un \u00e9l\u00e9ment<\/td><\/tr>
*<\/code><\/td>Le caract\u00e8re g\u00e9n\u00e9rique est utilis\u00e9 pour s\u00e9lectionner n'importe quel \u00e9l\u00e9ment<\/td><\/tr>
[ ]<\/code><\/td>Trouver un \u00e9l\u00e9ment sp\u00e9cifique<\/td><\/tr>
.<\/code><\/td>Sp\u00e9cifie l'\u00e9l\u00e9ment courant<\/td><\/tr>
..<\/code><\/td>Sp\u00e9cifie l'\u00e9l\u00e9ment parent<\/td><\/tr><\/tbody>
<\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n
\n\n\n\n

XPath<\/strong> fonctions<\/h2>\n\n\n\n
XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
\/\/h1<\/code><\/td>Extraire toutes les balises H1<\/td><\/tr>
\/\/h2[1]<\/code><\/td>Extraire la premi\u00e8re balise H2<\/td><\/tr>
\/\/h2[2]<\/code><\/td>Extraire la deuxi\u00e8me balise H2<\/td><\/tr>
\/\/div\/p<\/code><\/td>Extrait tout <p> contenu dans un <div><\/td><\/tr>
\/\/div[@class='auteur']<\/code><\/td>Extrait tout <div> avec la classe "auteur".<\/td><\/tr>
\/\/p[@class='content']<\/code><\/td>Extrait tout <p> avec la classe " contenu ".<\/td><\/tr>
\/\/* [@class='content']<\/code><\/td>Extrait tout \u00e9l\u00e9ment avec la classe \"content\".<\/td><\/tr>
\/\/ul\/li[last()]<\/code><\/td>Extrait le dernier
  • d'un
      .<\/td><\/tr>
  • \/\/ol[@class='cat']\/li[1]<\/code><\/td>Extrait le premier
  • dans un
      avec la classe \"cat\".<\/td><\/tr>
  • compte(\/\/h2)<\/code><\/td>Compte le nombre de H2 (d\u00e9finir le filtre d'extraction sur \"Valeur de la fonction\").<\/td><\/tr>
    \/\/a[contient(., 'en savoir plus')]<\/code><\/td>Extraire tout lien dont le texte d'ancrage contient \"en savoir plus\".<\/td><\/tr>
    \/\/a[starts-with(@title, 'Written by')]<\/code><\/td>Extrait tout lien dont le titre commence par \"\u00c9crit par\".<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Comment extraire les \u00e9l\u00e9ments HTML courants<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/@href<\/code><\/td>Extraction de tous les liens<\/td><\/tr>
    \/\/a[starts-with(@href, 'mailto')]\/@href<\/code><\/td>Extrait le lien qui commence par \"mailto :\" (adresse \u00e9lectronique)<\/td><\/tr>
    \/\/a[starts-with(@href, 'tel')]\/@href<\/code><\/td>Extrait le lien qui commence par \"tel :\" (num\u00e9ro de t\u00e9l\u00e9phone)<\/td><\/tr>
    \/\/img\/@src<\/code><\/td>Extraction de toutes les URL des sources d'images<\/td><\/tr>
    \/\/img[contient(@class, 'aligncenter')]\/@src<\/code><\/td>Extrait toutes les URLs des sources d'images contenant le nom de classe \"aligncenter\".<\/td><\/tr>
    \/\/lien[@rel='alternate']<\/code><\/td>Extrait les \u00e9l\u00e9ments dont l'attribut rel est d\u00e9fini sur \"alternate\".<\/td><\/tr>
    \/\/@hreflang<\/code><\/td>Extraction de toutes les valeurs hreflang<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire les m\u00e9tabalises (utiliser l'\u00e9l\u00e9ment HTML interne)<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/meta[@property='article:published_time']\/@content<\/code><\/td>Extraction de la date de publication de l'article (balise m\u00e9ta fr\u00e9quemment trouv\u00e9e sur les sites Web WordPress).<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extrait de l'Open Graph<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/meta[@property='og:type']\/@content<\/code><\/td>Extrait l'objet de type Open Graph<\/td><\/tr>
    \/\/meta[@property='og:image']\/@content<\/code><\/td>Extraction de l'URL de l'image vedette Open Graph<\/td><\/tr>
    \/\/meta[@property='og:updated_time']\/@content<\/code><\/td>Extraction de l'heure de mise \u00e0 jour de l'Open Graph<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire des cartes Twitter<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/meta[@name='twitter:card']\/@content<\/code><\/td>Extrait le type de carte Twitter<\/td><\/tr>
    \/\/meta[@name='twitter:title']\/@content<\/code><\/td>Extrait le titre de la carte Twitter<\/td><\/tr>
    \/\/meta[@name='twitter:site']\/@content<\/code><\/td>Extrait l'objet du site de la carte Twitter (poign\u00e9e Twitter)<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire les types de sch\u00e9mas<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/*[@itemtype]\/@itemtype<\/code><\/td>Extraction de tous les types de balisage de sch\u00e9ma sur une page<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma du fil d'Ariane<\/h2>\n\n\n\n

    Voici les extractions personnalis\u00e9es que vous utilisez pour v\u00e9rifier les breadcrumbs en Grenouille hurlante<\/a>.<\/p>\n\n\n\n

    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/*[contient(@itemtype, 'BreadcrumbList')]\/*[@itemprop]\/a\/@href<\/code><\/td>Extraire tous les liens du fil d'Ariane<\/td><\/tr>
    \/\/*[contains(@itemtype, 'BreadcrumbList')]\/*[@itemprop][1]\/a\/@href<\/code><\/td>Extrait le premier lien du fil d'Ariane<\/td><\/tr>
    \/\/*[contient(@itemtype, 'BreadcrumbList')]\/*[@itemprop]<\/code><\/td>Extraire les noms des fils d'Ariane (d\u00e9finir le filtre d'extraction \u00e0 \"Extraire le texte\")<\/td><\/tr>
    count(\/\/*[contains(@itemtype, 'BreadcrumbList')]\/*[@itemprop])<\/code><\/td>Compte le nombre d'\u00e9l\u00e9ments de la liste de fil d'Ariane (d\u00e9finir le filtre d'extraction \u00e0 \"Valeur de la fonction\")<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma du produit<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/*[@itemprop='nom']\/@content<\/code><\/td>Extrait le nom du produit<\/td><\/tr>
    \/\/*[@itemprop='description']\/@content<\/code><\/td>Extrait la description du produit<\/td><\/tr>
    \/\/*[@itemprop='prix']\/@content<\/code><\/td>Extrait le prix du produit<\/td><\/tr>
    \/\/*[@itemprop='priceCurrency']\/@content<\/code><\/td>Extraction de la devise du produit<\/td><\/tr>
    \/\/*[@itemprop='disponibilit\u00e9']\/@href<\/code><\/td>Extrait la disponibilit\u00e9 des produits<\/td><\/tr>
    \/\/*[@itemprop='sku']\/@content<\/code><\/td>Extraits du produit SKU<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extrait du sch\u00e9ma de r\u00e9vision<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/* [@itemprop='reviewCount']<\/code><\/td>Extraction du nombre de r\u00e9visions<\/td><\/tr>
    \/\/* [@itemprop='ratingValue']<\/code><\/td>Extrait la valeur de la notation<\/td><\/tr>
    \/\/* [@itemprop='bestRating']<\/code><\/td>Extraction de la meilleure note d'\u00e9valuation<\/td><\/tr>
    \/\/*[@itemprop='review']\/*[@itemprop='name']<\/code><\/td>Extrait le nom de la revue<\/td><\/tr>
    \/\/*[@itemprop='review']\/*[@itemprop='author']<\/code><\/td>Auteur de la revue Extraits<\/td><\/tr>
    \/\/*[@itemprop='review']\/*[@itemprop='datePublished']\/@content<\/code><\/td>Extrait la date de publication des revues<\/td><\/tr>
    \/\/*[@itemprop='review']\/*[@itemprop='reviewBody']<\/code><\/td>Extraire le contenu du corps des commentaires<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma des entreprises et organisations locales<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/*[contains(@itemtype, 'Organization')]\/*[@itemprop='name']<\/code><\/td>Extrait le nom de l'organisation<\/td><\/tr>
    \/\/*[@itemprop='adresse']\/*[@itemprop='streetAddress']<\/code><\/td>Extrait l'adresse de la rue<\/td><\/tr>
    \/\/*[@itemprop='address']\/*[@itemprop='addressLocality']<\/code><\/td>Extrait la localit\u00e9 de l'adresse<\/td><\/tr>
    \/\/*[@itemprop='address']\/*[@itemprop='addressRegion']<\/code><\/td>Extrait la r\u00e9gion d'adresse<\/td><\/tr>
    \/\/* [@itemprop='telephone']<\/code><\/td>Extrait le num\u00e9ro de t\u00e9l\u00e9phone<\/a><\/td><\/tr>
    \/\/*[@itemprop='sameAs']\/@href<\/code><\/td>Extraction des liens \"sameAs\".<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma de l'article<\/h2>\n\n\n\n
    XPATH<\/th>SORTIE<\/th><\/tr><\/thead>
    \/\/*[contains(@itemtype, 'Article')]\/*[@itemprop='headline']<\/code><\/td>Extrait le titre de l'article<\/td><\/tr>
    \/\/*[@itemprop='auteur']\/*[@itemprop='nom']\/@content<\/code><\/td>Extrait le nom de l'auteur<\/td><\/tr>
    \/\/*[@itemprop='publisher']\/*[@itemprop='name']\/@content<\/code><\/td>Extrait le nom de l'\u00e9diteur<\/td><\/tr>
    \/\/*[@itemprop='datePublished']\/@content<\/code><\/td>Extraits de la date de publication<\/td><\/tr>
    \/\/*[@itemprop='dateModified']\/@content<\/code><\/td>Extrait la date de modification<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n
    \n\n\n\n

    Extraction de donn\u00e9es personnalis\u00e9es avec Regex<\/strong><\/h2>\n\n\n\n

    Wildcards<\/h3>\n\n\n\n
    SYNTAX<\/th>FONCTION<\/th><\/tr><\/thead>
    .<\/code><\/td>Correspond \u00e0 un caract\u00e8re quelconque<\/td><\/tr>
    *<\/code><\/td>Faire correspondre le caract\u00e8re pr\u00e9c\u00e9dent 0 fois ou plus<\/td><\/tr>
    ?<\/code><\/td>Faire correspondre le caract\u00e8re pr\u00e9c\u00e9dent 0 ou 1 fois<\/td><\/tr>
    +<\/code><\/td>Faire correspondre le caract\u00e8re pr\u00e9c\u00e9dent 1 ou plusieurs fois<\/td><\/tr>
    |<\/code><\/td>OU<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Ancres<\/h3>\n\n\n\n
    SYNTAX<\/th>FONCTION<\/th><\/tr><\/thead>
    ^<\/code><\/td>La cha\u00eene de caract\u00e8res commence par le caract\u00e8re suivant.<\/td><\/tr>
    $<\/code><\/td>La cha\u00eene de caract\u00e8res se termine par le caract\u00e8re pr\u00e9c\u00e9dent.<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Groupes<\/h3>\n\n\n\n
    SYNTAX<\/th>FONCTION<\/th><\/tr><\/thead>
    ( )<\/code><\/td>Faire correspondre les caract\u00e8res joints dans l'ordre exact<\/td><\/tr>
    [ ]<\/code><\/td>Faire correspondre les caract\u00e8res joints dans n'importe quel ordre<\/td><\/tr>
    -<\/code><\/td>Correspond \u00e0 tous les caract\u00e8res dans la plage sp\u00e9cifi\u00e9e<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Escape<\/h3>\n\n\n\n
    SYNTAX<\/th>FONCTION<\/th><\/tr><\/thead>
    \\<\/code><\/td>Traite le caract\u00e8re litt\u00e9ralement, pas comme une regex.<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraction de donn\u00e9es personnalis\u00e9e Regex<\/h2>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"'](UA-.* ?)[\"']<\/code><\/td>Extraire l'ID de suivi de Google Analytics<\/td><\/tr>
    [\"'](G-.* ?)[\"']<\/code><\/td>Extraire l'ID de suivi de Google Analytics 4 (GA4)<\/td><\/tr>
    [\"' \"](AW-.* ?) [\"' \"]<\/code><\/td>Extraire l'ID de conversion Google Ads et\/ou le tag de remarketing<\/td><\/tr>
    [\"'](GTM-.* ?)[\"']<\/code><\/td>Extraire l'ID de Google Tag Manager et\/ou de Google Optimize<\/td><\/tr>
    fbq\\([\"']init[\"'], [\"'](.*?)[\"']<\/code><\/td>Extraire l'ID du pixel Facebook<\/td><\/tr>
    \\{ti :[\"'](.* ?)[\"']\\}<\/code><\/td>Extraire la balise UET de Bing Ads<\/td><\/tr>
    adroll_adv_id = [\"'](.* ?) [\"']<\/code><\/td>Extraire l'ID de l'annonceur AdRoll<\/td><\/tr>
    adroll_pix_id = [\"'](.* ?) [\"']<\/code><\/td>Extraire l'ID du pixel AdRoll<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire tout le balisage de sch\u00e9ma et les types de sch\u00e9ma<\/h2>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"']application\/ld\\+json[\"']>(.* ?)<\/code><\/td>Extraction de toutes les balises du sch\u00e9ma JSON-LD.<\/td><\/tr>
    [\"']@type[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait tous les types de balises de sch\u00e9ma JSON-LD d'une page.<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma du fil d'Ariane<\/h3>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"']item[\"'] : *[\"']@id[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extraction des liens du fil d'Ariane<\/td><\/tr>
    [\"']item[\"'] : *[\"']@id[\"'] : *[\"'].* ?[\"'], *[\"']nom[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extraction des noms de fil d'Ariane<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma du produit<\/h3>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"']@type[\"'] : *[\"']Product[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait le nom du produit<\/td><\/tr>
    [\"']@type[\"'] : *[\"']Product[\"'].*?[\"']description[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait la description du produit<\/td><\/tr>
    [\"']@type[\"'] : *[\"']Product[\"'].*?[\"']price[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait le prix du produit<\/td><\/tr>
    [\"']@type[\"'] : *[\"']Product[\"'].*?[\"']priceCurrency[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extraction de la devise du produit<\/td><\/tr>
    [\"']@type[\"'] : *[\"']Product[\"'].*?[\"']availability[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait la disponibilit\u00e9 des produits<\/td><\/tr>
    [\"']@type[\"'] : *[\"']Product[\"'].*?[\"']sku[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extraits du produit SKU<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extrait du sch\u00e9ma de r\u00e9vision<\/h3>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"']reviewCount[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extraction du nombre de r\u00e9visions<\/td><\/tr>
    [\"']ratingValue[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait la valeur de la notation<\/td><\/tr>
    [\"']bestRating[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extraire la meilleure note<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma des entreprises et organisations locales<\/h3>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"']@type[\"'] : *[\"']Organization[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait le nom de l'organisation<\/td><\/tr>
    [\"']streetAddress[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait l'adresse de la rue<\/td><\/tr>
    [\"']addressLocality[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait la localit\u00e9 de l'adresse<\/td><\/tr>
    [\"']addressRegion[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait la r\u00e9gion d'adresse<\/td><\/tr>
    [\"']t\u00e9l\u00e9phone[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait le num\u00e9ro de t\u00e9l\u00e9phone<\/td><\/tr>
    [\"']sameAs[\"'] : *\\[(.* ?)\\]<\/code><\/td>Extraction des liens \"sameAs\".<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraire le sch\u00e9ma d'un article ou d'un billet de blog<\/h3>\n\n\n\n
    REGEX<\/th>SORTIE<\/th><\/tr><\/thead>
    [\"']headline[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait du titre de l'article<\/td><\/tr>
    [\"']author[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait le nom de l'auteur<\/td><\/tr>
    [\"']publisher[\"'].*?[\"']name[\"']: *[\"'](.* ?)[\"']<\/code><\/td>Extrait le nom de l'\u00e9diteur<\/td><\/tr>
    [\"']datePublished[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extraits de la date de publication<\/td><\/tr>
    [\"']dateModified[\"'] : *[\"'](.* ?)[\"']<\/code><\/td>Extrait la date de modification<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Les possibilit\u00e9s sont infinies ; n'h\u00e9sitez pas \u00e0 me faire savoir si vous souhaitez que des extractions soient ajout\u00e9es \u00e0 cette liste.<\/p>\n\n\n