{"id":2446,"date":"2021-03-10T17:52:12","date_gmt":"2021-03-10T17:52:12","guid":{"rendered":"https:\/\/seonorth.ca\/?page_id=2446"},"modified":"2025-02-15T21:17:48","modified_gmt":"2025-02-15T21:17:48","slug":"custom-extraction","status":"publish","type":"page","link":"https:\/\/seonorth.ca\/es\/screaming-frog\/custom-extraction\/","title":{"rendered":"Extracciones personalizadas de Screaming Frog: Gu\u00eda para la extracci\u00f3n de datos de rastreo"},"content":{"rendered":"

Screaming Frog (screamingfrog.co.uk) es una potente herramienta SEO con muchas caracter\u00edsticas de optimizaci\u00f3n de motores de b\u00fasqueda, incluyendo extracciones personalizadas, que le permiten extraer datos de sus rastreos f\u00e1cilmente. Esta entrada de blog discutir\u00e1 c\u00f3mo funciona Screaming Frog Custom Extraction y por qu\u00e9 puede ayudar a mejorar sus esfuerzos de SEO, marketing digital de comercio electr\u00f3nico y estrategias de indexaci\u00f3n.<\/p>\n\n\n\n

\"Extracci\u00f3n<\/figure>\n\n\n\n

Los sitios web tienen una tonelada de informaci\u00f3n \u00fatil - la mayor\u00eda de las veces, es demasiado laborioso o complicado visitar cada p\u00e1gina de un sitio web para copiar los datos del producto, metadatos, etiquetas de t\u00edtulo y texto de anclaje en una hoja de c\u00e1lculo. Aqu\u00ed es donde Screaming Frog viene al rescate con extracciones de datos de b\u00fasqueda personalizadas, utilizando API y expresiones regulares para automatizar el proceso. Las extracciones personalizadas son una forma de raspado web, recolecci\u00f3n web o extracci\u00f3n de datos web que se utiliza para raspar y extraer datos de sitios web, lo que le permite almacenarlos localmente en su ordenador.<\/p>\n\n\n\n

Para los principiantes, algunas preguntas que pueden tener:<\/p>\n\n\n\n

\u00bfQu\u00e9 es el <\/strong>Screaming Frog SEO Spider<\/strong>?<\/strong><\/h2>\n\n\n\n

El software Screaming Frog SEO Spider es un rastreador de sitios web que mejora el SEO in situ extrayendo y analizando los datos estructurados de su sitio web mediante una interfaz gr\u00e1fica de usuario (GUI), manejando eficazmente el contenido XML y JavaScript.<\/p>\n\n\n\n

\u00bfCu\u00e1les son <\/strong>extracciones personalizadas<\/strong>?<\/strong><\/h2>\n\n\n\n

Las extracciones personalizadas son funciones de la ara\u00f1a SEO de Screaming Frog para extraer informaci\u00f3n expl\u00edcita de las p\u00e1ginas web. Estas extracciones ayudan a optimizar su sitio para una auditor\u00eda SEO T\u00e9cnica, incluyendo resultados de b\u00fasqueda, recopilando datos esenciales sobre su copia, y ayudando a localizar y corregir errores en encabezados y otros elementos.<\/p>\n\n\n\n

\u00bfC\u00f3mo se hace la extracci\u00f3n de datos?<\/strong><\/h2>\n\n\n\n

Utilice Screaming Frog si desea procesar la extracci\u00f3n de datos, que consiste en extraer los datos necesarios de su sitio web. La informaci\u00f3n se guarda dentro de la memoria de Screaming Frog, d\u00e1ndole la opci\u00f3n de exportar los resultados escaneados a Excel o Google Sheets para su posterior revisi\u00f3n. Esto puede incluir datos de men\u00fas desplegables y estructuras de enlaces internos.<\/p>\n\n\n\n

\u00bfPor qu\u00e9 es fundamental la extracci\u00f3n de datos?<\/strong><\/h2>\n\n\n\n

La extracci\u00f3n de datos le permite recoger grandes cantidades de datos de forma r\u00e1pida y eficaz. Esta automatizaci\u00f3n le proporciona resultados inmediatos de arquitectura web. Este proceso le ahorra tiempo y recursos mientras que le da los datos valiosos que necesitar\u00e1 para planificar y elaborar estrategias de optimizaci\u00f3n de motores de b\u00fasqueda. Screaming Frog es el go-to Web Scraper Tool para SEOs y un extractor de datos. Las opciones son infinitas; aqu\u00ed hay un mont\u00f3n de sintaxis personalizadas de web-scraping. Echa un vistazo al tutorial a continuaci\u00f3n.<\/p>\n\n\n\n

C\u00f3mo extraer datos personalizados con Screaming Frog<\/h2>\n\n\n\n

Utilice Screaming Frog si desea procesar la extracci\u00f3n de datos, que consiste en extraer los datos necesarios de su sitio web. La informaci\u00f3n se guarda en la memoria de Screaming Frog, d\u00e1ndole la opci\u00f3n de exportar los resultados escaneados a Excel o Google Sheets para su posterior revisi\u00f3n. Para necesidades m\u00e1s avanzadas, puede incorporar expresiones regulares para apuntar con precisi\u00f3n y extraer patrones espec\u00edficos de su contenido HTML o JavaScript renderizado, incluyendo nodos y fragmentos.<\/p>\n\n\n\n

Al integrar estas t\u00e9cnicas, puede optimizar su estrategia SEO de forma eficaz, aprovechando la potencia de herramientas como Screaming Frog e incluso utilizando tecnolog\u00edas de IA como ChatGPT para obtener informaci\u00f3n m\u00e1s profunda.<\/p>\n\n\n\n

1. En ScreamingFrog, vaya a Configuraci\u00f3n > Personalizada > Extracci\u00f3n.<\/strong><\/p>\n\n\n\n

\"Extracci\u00f3n
Extracci\u00f3n personalizada de Screaming Frog<\/figcaption><\/figure>\n\n\n\n

2. A continuaci\u00f3n, deber\u00e1 +A\u00f1adir<\/strong> y configure sus reglas de extracci\u00f3n.<\/p>\n\n\n\n

\"Ajustes
Seleccionar elementos de HTML interno mediante la pesta\u00f1a de Extracci\u00f3n Personalizada<\/figcaption><\/figure>\n\n\n\n

3. A\u00f1ade un T\u00edtulo<\/strong>,
4. Seleccione si necesita CSSPath, XPath\r\n \r\n \r\n \r\n <\/g>\r\n \r\n \r\n \r\n <\/clippath>\r\n <\/defs><\/svg><\/span><\/a>o Regex<\/use><\/svg><\/span><\/a><\/strong>,
5. A\u00f1ade tu funci\u00f3n de b\u00fasqueda<\/strong>. <\/p>\n\n\n\n

Si no est\u00e1 seguro de qu\u00e9 selector o funci\u00f3n necesita, consulte los ejemplos siguientes o utilice la funci\u00f3n de inspecci\u00f3n de elementos en Herramientas de desarrollo de Google Chrome<\/a>. Puede abrir Dev Tools haciendo \"clic con el bot\u00f3n derecho\" en el navegador Google Chrome.<\/p>\n\n\n\n

Ejemplo:<\/h3>\n\n\n\n

He aqu\u00ed un ejemplo raspar<\/a> para un ID de p\u00edxel de Facebook<\/p>\n\n\n\n

\"Extracci\u00f3n
Extracci\u00f3n del ID del p\u00edxel de Facebook<\/figcaption><\/figure>\n\n\n\n

En el Resultados<\/strong>Como puedes ver, a una de mis p\u00e1ginas le falta un p\u00edxel de Facebook:<\/p>\n\n\n\n

\"Falta
Falta el ID de Facebook<\/figcaption><\/figure>\n\n\n\n

A continuaci\u00f3n encontrar\u00e1 conjuntos de datos de extracci\u00f3n personalizados predefinidos para que pueda empezar.<\/p>\n\n\n\n

Sintaxis b\u00e1sica para utilizar XPath Web Scraping<\/h2>\n\n\n\n
SYNTAX<\/th>FUNCI\u00d3N<\/th><\/tr><\/thead>
\/\/<\/code><\/td>Buscar en cualquier parte del documento<\/td><\/tr>
\/<\/code><\/td>Buscar dentro de la ra\u00edz del sitio web<\/use><\/svg><\/span><\/a><\/td><\/tr>
@<\/code><\/td>
Seleccionar un atributo espec\u00edfico de un elemento<\/td><\/tr>
*<\/code><\/td>El comod\u00edn se utiliza para seleccionar cualquier elemento<\/td><\/tr>
[ ]<\/code><\/td>Buscar un elemento espec\u00edfico<\/td><\/tr>
.<\/code><\/td>Especifica el elemento actual<\/td><\/tr>
..<\/code><\/td>Especifica el elemento padre<\/td><\/tr><\/tbody>
<\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n
\n\n\n\n

XPath<\/strong> funciones<\/h2>\n\n\n\n
XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
\/\/h1<\/code><\/td>Extraer todas las etiquetas H1<\/td><\/tr>
\/\/h2[1]<\/code><\/td>Extraer la primera etiqueta H2<\/td><\/tr>
\/\/h2[2]<\/code><\/td>Extraer la segunda etiqueta H2<\/td><\/tr>
\/\/div\/p<\/code><\/td>Extrae cualquier <p> contenida en un <div><\/td><\/tr>
\/\/div[@class='author']<\/code><\/td>Extrae cualquier <div> con clase "autor"<\/td><\/tr>
\/\/p[@class='content']<\/code><\/td>Extrae cualquier <p> con clase "contenido"<\/td><\/tr>
\/\/*[@class='content']<\/code><\/td>Extrae cualquier elemento con clase \"contenido\"<\/td><\/tr>
\/\/ul\/li[last()]<\/code><\/td>Extrae el \u00faltimo
  • de un
      <\/td><\/tr>
  • \/\/ol[@class='cat']\/li[1]<\/code><\/td>Extrae el primer
  • de un
      con clase \"cat\"<\/td><\/tr>
  • count(\/\/h2)<\/code><\/td>Cuenta el n\u00famero de H2 (ajuste el filtro de extracci\u00f3n a \"Valor de la funci\u00f3n\")<\/td><\/tr>
    \/\/a[contiene(.,'saber m\u00e1s')]<\/code><\/td>Extrae cualquier enlace con un texto de anclaje que contenga \"aprender m\u00e1s\"<\/td><\/tr>
    \/\/a[empieza-con(@t\u00edtulo,'Escrito por')]<\/code><\/td>Extrae cualquier enlace con un t\u00edtulo que empiece por \"Escrito por\".<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    C\u00f3mo extraer elementos HTML comunes<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/@href<\/code><\/td>Extrae todos los enlaces<\/td><\/tr>
    \/\/a[starts-with(@href,'mailto')]\/@href<\/code><\/td>Extrae el enlace que empieza por \"mailto:\" (direcci\u00f3n de correo electr\u00f3nico)<\/td><\/tr>
    \/\/a[comienza-con(@ref,'tel')]\/@ref<\/code><\/td>Extrae el enlace que empieza por \"tel:\" (n\u00famero de tel\u00e9fono)<\/td><\/tr>
    \/\/img\/@src<\/code><\/td>Extrae todas las URLs de origen de las im\u00e1genes<\/td><\/tr>
    \/\/img[contains(@class,'aligncenter')]\/@src<\/code><\/td>Extrae todas las URLs de origen de las im\u00e1genes que contienen el nombre de clase \"aligncenter\".<\/td><\/tr>
    \/\/link[@rel='alternate']<\/code><\/td>Extrae los elementos con el atributo rel establecido como \"alternate\".<\/td><\/tr>
    \/\/@hreflang<\/code><\/td>Extrae todos los valores de hreflang<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer las metaetiquetas (utilizar el elemento HTML interior)<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/meta[@propiedad='art\u00edculo:hora de publicaci\u00f3n']\/@contenido<\/code><\/td>Extrae la fecha de publicaci\u00f3n del art\u00edculo (etiqueta meta com\u00fan en los sitios web de WordPress)<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el gr\u00e1fico abierto<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/meta[@property='og:type']\/@content<\/code><\/td>Extrae el objeto de tipo Open Graph<\/td><\/tr>
    \/\/meta[@propiedad='og:imagen']\/@contenido<\/code><\/td>Extrae la URL de la imagen destacada de Open Graph<\/td><\/tr>
    \/\/meta[@property='og:updated_time']\/@content<\/code><\/td>Extrae la hora actualizada de Open Graph<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer tarjetas de Twitter<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/meta[@name='twitter:card']\/@content<\/code><\/td>Extrae el tipo de tarjeta de Twitter<\/td><\/tr>
    \/\/meta[@name='twitter:title']\/@content<\/code><\/td>Extrae el t\u00edtulo de la tarjeta de Twitter<\/td><\/tr>
    \/\/meta[@name='twitter:site']\/@content<\/code><\/td>Extrae el objeto del sitio de la tarjeta de Twitter (el mango de Twitter)<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer tipos de esquemas<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/*[@tipo de art\u00edculo]\/@tipo de art\u00edculo<\/code><\/td>Extrae todos los tipos de marcado del esquema en una p\u00e1gina<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema de migas de pan<\/h2>\n\n\n\n

    Estas son las extracciones personalizadas que se utilizan para comprobar las migas de pan en La Rana Gritona<\/a>.<\/p>\n\n\n\n

    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/*[contains(@itemtype,'BreadcrumbList')]\/*[@itemprop]\/a\/@href<\/code><\/td>Extrae todos los enlaces de migas de pan<\/td><\/tr>
    \/\/*[contains(@itemtype,'BreadcrumbList')]\/*[@itemprop][1]\/a\/@href<\/code><\/td>Extrae el primer enlace de migas de pan<\/td><\/tr>
    \/\/*[contains(@itemtype,'BreadcrumbList')]\/*[@itemprop]<\/code><\/td>Extrae los nombres de las migas de pan (establezca el filtro de extracci\u00f3n en \"Extraer texto\")<\/td><\/tr>
    count(\/\/*[contains(@itemtype,'BreadcrumbList')]\/*[@itemprop])<\/code><\/td>Cuenta el n\u00famero de elementos de la lista de migas de pan (ajuste el filtro de extracci\u00f3n a \"Valor de la funci\u00f3n\")<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema del producto<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/*[@itemprop='nombre']\/@contenido<\/code><\/td>Extrae el nombre del producto<\/td><\/tr>
    \/\/*[@itemprop='descripci\u00f3n']\/@content<\/code><\/td>Extrae la descripci\u00f3n del producto<\/td><\/tr>
    \/\/*[@itemprop='precio']\/@contenido<\/code><\/td>Extrae el precio del producto<\/td><\/tr>
    \/\/*[@itemprop='precioMoneda']\/@content<\/code><\/td>Extrae la moneda del producto<\/td><\/tr>
    \/\/*[@itemprop='disponibilidad']\/@href<\/code><\/td>Extrae la disponibilidad de los productos<\/td><\/tr>
    \/\/*[@itemprop='sku']\/@content<\/code><\/td>Extrae el SKU del producto<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema de revisi\u00f3n<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/*[@itemprop='reviewCount']<\/code><\/td>Recuento de la revisi\u00f3n de extractos<\/td><\/tr>
    \/\/*[@itemprop='ratingValue']<\/code><\/td>Extrae el valor de la calificaci\u00f3n<\/td><\/tr>
    \/\/*[@itemprop='bestRating']<\/code><\/td>Extrae la mejor valoraci\u00f3n de las cr\u00edticas<\/td><\/tr>
    \/\/*[@itemprop='revisi\u00f3n']\/*[@itemprop='nombre']<\/code><\/td>Extrae el nombre de la revisi\u00f3n<\/td><\/tr>
    \/\/*[@itemprop='revisi\u00f3n']\/*[@itemprop='autor']<\/code><\/td>Extractos de la rese\u00f1a del autor<\/td><\/tr>
    \/\/*[@itemprop='revisi\u00f3n']\/*[@itemprop='fechaPublicaci\u00f3n']\/@content<\/code><\/td>Extrae la fecha de publicaci\u00f3n de las rese\u00f1as<\/td><\/tr>
    \/\/*[@itemprop='review']\/*[@itemprop='reviewBody']<\/code><\/td>Extrae el contenido del cuerpo de las rese\u00f1as<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema de empresas y organizaciones locales<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/*[contains(@itemtype,'Organizaci\u00f3n')]\/*[@itemprop='nombre']<\/code><\/td>Extrae el nombre de la organizaci\u00f3n<\/td><\/tr>
    \/\/*[@itemprop='direcci\u00f3n']\/*[@itemprop='direcci\u00f3n']<\/code><\/td>Extrae la direcci\u00f3n de la calle<\/td><\/tr>
    \/\/*[@itemprop='direcci\u00f3n']\/*[@itemprop='direcci\u00f3nLocalidad']<\/code><\/td>Extrae la localidad de la direcci\u00f3n<\/td><\/tr>
    \/\/*[@itemprop='direcci\u00f3n']\/*[@itemprop='direcci\u00f3nRegi\u00f3n']<\/code><\/td>Extrae la regi\u00f3n de la direcci\u00f3n<\/td><\/tr>
    \/\/*[@itemprop='tel\u00e9fono']<\/code><\/td>Extrae el n\u00famero de tel\u00e9fono<\/a><\/td><\/tr>
    \/\/*[@itemprop='sameAs']\/@href<\/code><\/td>Extrae los enlaces \"sameAs\"<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema del art\u00edculo<\/h2>\n\n\n\n
    XPATH<\/th>SALIDA<\/th><\/tr><\/thead>
    \/\/*[contains(@itemtype,'Art\u00edculo')]\/*[@itemprop='titular']<\/code><\/td>Extrae el titular del art\u00edculo<\/td><\/tr>
    \/\/*[@itemprop='autor']\/*[@itemprop='nombre']\/@content<\/code><\/td>Extrae el nombre del autor<\/td><\/tr>
    \/\/*[@itemprop='editor']\/*[@itemprop='nombre']\/@content<\/code><\/td>Extrae el nombre del editor<\/td><\/tr>
    \/\/*[@itemprop='datePublished']\/@content<\/code><\/td>Extractos fecha de publicaci\u00f3n<\/td><\/tr>
    \/\/*[@itemprop='dateModified']\/@content<\/code><\/td>Extrae la fecha de modificaci\u00f3n<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n
    \n\n\n\n

    Extracci\u00f3n de datos a medida con Regex<\/strong><\/h2>\n\n\n\n

    Comodines<\/h3>\n\n\n\n
    SYNTAX<\/th>FUNCI\u00d3N<\/th><\/tr><\/thead>
    .<\/code><\/td>Coincidir con 1 car\u00e1cter cualquiera<\/td><\/tr>
    *<\/code><\/td>Coincidir con el car\u00e1cter precedente 0 o m\u00e1s veces<\/td><\/tr>
    ?<\/code><\/td>Coincidir con el car\u00e1cter precedente 0 o 1 vez<\/td><\/tr>
    +<\/code><\/td>Coincidir con el car\u00e1cter anterior 1 o m\u00e1s veces<\/td><\/tr>
    |<\/code><\/td>O<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Anclas<\/h3>\n\n\n\n
    SYNTAX<\/th>FUNCI\u00d3N<\/th><\/tr><\/thead>
    ^<\/code><\/td>La cadena comienza con el car\u00e1cter siguiente.<\/td><\/tr>
    $<\/code><\/td>La cadena termina con el car\u00e1cter anterior.<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Grupos<\/h3>\n\n\n\n
    SYNTAX<\/th>FUNCI\u00d3N<\/th><\/tr><\/thead>
    ( )<\/code><\/td>Coincidir con los caracteres adjuntos en el orden exacto<\/td><\/tr>
    [ ]<\/code><\/td>Coincidir con los caracteres encerrados en cualquier orden<\/td><\/tr>
    -<\/code><\/td>Coincidir con cualquier car\u00e1cter dentro del rango especificado<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Escape<\/h3>\n\n\n\n
    SYNTAX<\/th>FUNCI\u00d3N<\/th><\/tr><\/thead>
    \\<\/code><\/td>Tratar el car\u00e1cter literalmente, no como regex.<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extracci\u00f3n de datos personalizados Regex<\/h2>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"'](UA-.*?)[\"']<\/code><\/td>Extraer el ID de seguimiento de Google Analytics<\/td><\/tr>
    [\"'](G-.*?)[\"']<\/code><\/td>Extraer el ID de seguimiento de Google Analytics 4 (GA4)<\/td><\/tr>
    [\"'](AW-.*?)[\"']<\/code><\/td>Extraer el ID de conversi\u00f3n de Google Ads y\/o la etiqueta de remarketing<\/td><\/tr>
    [\"'](GTM-.*?)[\"']<\/code><\/td>Extraer el ID de Google Tag Manager y\/o Google Optimize<\/td><\/tr>
    fbq\\([\"']init[\"'], [\"'](.*?)[\"']<\/code><\/td>Extraer el ID del p\u00edxel de Facebook<\/td><\/tr>
    \\{{ti:[\"'](.*?)[\"']\\N-}<\/code><\/td>Extraer la etiqueta UET de Bing Ads<\/td><\/tr>
    adroll_adv_id = [\"'](.*?)[\"']<\/code><\/td>Extraer el ID de anunciante de AdRoll<\/td><\/tr>
    adroll_pix_id = [\"'](.*?)[\"']<\/code><\/td>Extraer el ID de p\u00edxel de AdRoll<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer todo el marcado de esquema y los tipos de esquema<\/h2>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"']application\/ld\\+json[\"']>(.*?)<\/code><\/td>Extrae todas las marcas del esquema JSON-LD<\/td><\/tr>
    [\"']@tipo[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae todos los tipos de marcado del esquema JSON-LD en una p\u00e1gina<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema de migas de pan<\/h3>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"']item[\"']: *[\"']@id[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae los enlaces de migas de pan<\/td><\/tr>
    [\"']item[\"']: *[\"']@id[\"']: *[\"'].*?[\"'], *[\"']nombre[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae los nombres de las migas de pan<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema del producto<\/h3>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"']@type[\"']: *[\"']Product[\"'].*?[\"']name[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el nombre del producto<\/td><\/tr>
    [\"']@tipo[\"']: *[\"']Product[\"'].*?[\"']description[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la descripci\u00f3n del producto<\/td><\/tr>
    [\"']@tipo[\"']: *[\"']Product[\"'].*?[\"']price[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el precio del producto<\/td><\/tr>
    [\"']@type[\"']: *[\"']Product[\"'].*?[\"']priceCurrency[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la moneda del producto<\/td><\/tr>
    [\"']@type[\"']: *[\"']Product[\"'].*?[\"']availability[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la disponibilidad de los productos<\/td><\/tr>
    [\"']@type[\"']: *[\"']Product[\"'].*?[\"']sku[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el SKU del producto<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema de revisi\u00f3n<\/h3>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"']reviewCount[\"']: *[\"'](.*?)[\"']<\/code><\/td>Recuento de la revisi\u00f3n de extractos<\/td><\/tr>
    [\"']ratingValue[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el valor de la calificaci\u00f3n<\/td><\/tr>
    [\"']bestRating[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la mejor calificaci\u00f3n<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema de empresas y organizaciones locales<\/h3>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"']@tipo[\"']: *[\"']Organization[\"'].*?[\"']name[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el nombre de la organizaci\u00f3n<\/td><\/tr>
    [\"']direcci\u00f3n[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la direcci\u00f3n de la calle<\/td><\/tr>
    [\"']direcci\u00f3nLocalidad[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la localidad de la direcci\u00f3n<\/td><\/tr>
    [\"']direcci\u00f3nRegi\u00f3n[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la regi\u00f3n de la direcci\u00f3n<\/td><\/tr>
    [\"']tel\u00e9fono[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el n\u00famero de tel\u00e9fono<\/td><\/tr>
    [\"']sameAs[\"']: *\\[(.*?)\\]<\/code><\/td>Extrae los enlaces \"sameAs\"<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Extraer el esquema del art\u00edculo o del blogposting<\/h3>\n\n\n\n
    REGEX<\/th>SALIDA<\/th><\/tr><\/thead>
    [\"']titular[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el titular del art\u00edculo<\/td><\/tr>
    [\"']author[\"'].*?[\"']name[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el nombre del autor<\/td><\/tr>
    [\"']publisher[\"'].*?[\"']name[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae el nombre del editor<\/td><\/tr>
    [\"']datePublished[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extractos fecha de publicaci\u00f3n<\/td><\/tr>
    [\"']dateModified[\"']: *[\"'](.*?)[\"']<\/code><\/td>Extrae la fecha de modificaci\u00f3n<\/td><\/tr><\/tbody>
    <\/td><\/td><\/tr><\/tfoot><\/table><\/figure>\n\n\n\n

    Las posibilidades son infinitas; por favor, h\u00e1game saber si quiere que se a\u00f1ada alguna extracci\u00f3n a esta lista.<\/p>\n\n\n