Hoe kin ik in grutte side crawlje en gegevens útpakke mei de SEO-spin fan Screaming Frog

Screaming Frog SEO Spider
Lêzetiid: 3 minuten

Wy helpe no ferskate kliïnten mei Marketo-migraasjes, Om't grutte bedriuwen sa oplossings brûke foar bedriuwen, is it as in spinweb dat himsels oer jierren weeft yn prosessen en platfoarms ... oant it punt dat bedriuwen har net iens bewust binne fan elk touchpoint.

Mei in automatisearingsplatfoarm foar bedriuwsmarketing lykas Marketo binne foarmen it yngongspunt fan gegevens oer siden en lâningsiden. Bedriuwen hawwe faak tûzenen siden en hûnderten formulieren op har siden dy't moatte wurde identifisearre foar fernijing.

In geweldich ark hjirfoar is Screaming Frog's SEO Spider... faaks it populêrste platfoarm yn 'e merke foar it crawlen, kontrolearjen en útfieren fan gegevens fan in side. It platfoarm is funksjeryk en biedt hûnderten opsjes foar frijwol elke taak dy't jo nedich binne.

Screaming Frog SEO Spider: Crawl En Extract

In wichtich skaaimerk fan Screaming Frog SEO Spider is dat jo oanpaste ekstraksjes kinne útfiere basearre op Regex, XPath, of CSSPath spesifikaasjes. Dit komt heul nuttich yn as wy de siden fan 'e kliïnt wolle crawlje en de MunchkinID- en FormId-wearden fan siden kontrolearje en fêstlizze.

Mei it ark iepenje Konfiguraasje> Oanpast> Ekstraasje om eleminten te identifisearjen dy't jo wolle ekstrahearje.

screamingfrog oanpaste ekstraksje

It ekstraksje-skerm makket frijwol unbeheinde gegevensfersameling mooglik:

Screaming Frog SEO Spider Extraction Rules

Regex, XPath, en CSSPath ekstraksje

Foar de MunchkinID leit de identifier binnen it formulierscript dat binnen de pagina is:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Wy jilde dan in Regex-regel om de id op te nimmen fanút it skripttag dat yn 'e pagina is ynfoege:

Regex: ["']id["']: *["'](.*?)["']

Foar de formulier-ID binne de gegevens yn in ynfiertag binnen it Marketo-formulier:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Wy jilde in XPath regel om de id op te nimmen fanút it formulier dat yn de pagina is ynfoege De XPath-fraach freget nei in formulier mei in ynfier mei de namme fan formid, dan bewarret de ekstraksje de wearde:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Javascript Rendering

In oare geweldige opsje fan Screaming Frog is dat jo net beheind binne ta de HTML op 'e pagina, jo kinne elk JavaScript werjaan dat formulieren sil ynfoegje op jo side. Binnen Konfiguraasje> Spider, kinne jo gean nei it tabblêd Rendering en dit ynskeakelje.

Screaming Frog SEO Spider Javascript Rendering

Dit duorret fansels wat langer om de side te crawljen, mar jo krije formulieren dy't client-side wurde werjûn troch JavaScript, lykas formulieren dy't server-side binne ynfoege.

Hoewol dit in heul spesifike applikaasje is, is it in ûnbidich nuttige applikaasje as jo mei grutte siden wurkje. Jo wolle perfoarst kontrolearje wêr't jo formulieren binne ynbêde troch de side.

Download Screaming Frog SEO Spider

Wat tinksto?

Dizze side brûkt Akismet om spam te ferleegjen. Learje hoe't jo kommentaargegevens ferwurke wurde.