Vous êtes ici : Miss SEO Girl » Boite Ă  Outils » OnCrawl, performant crawler & puissant outil d’analyse de logs

OnCrawl, performant crawler & puissant outil d’analyse de logs

Hello les SEO addicted 😊 Je vous ai promis il y a un moment une suite d’articles prĂ©sentant des outils SEO que je trouve vraiment canons, c’est maintenant !

AprĂšs RM Tech, Yooda Insight, Dareboost, Vavry et Outiref, Myposeo ainsi que 3 outils pour la recherche de mots clĂ©s, je vous prĂ©sente aujourd’hui sur le blog, un autre super #tool #seo que j’ai eu la chance de tester : OnCrawl !

Je suis sĂ»re que vous allez avoir envie de le tester et une fois que vous aurez compris toute la puissance et l’utilitĂ© de l’outil, vous ne pourrez plus vous en passer. Suivez-moi pour une prĂ©sentation rapide de ses principales fonctionnalitĂ©s et l’intĂ©rĂȘt que vous avez Ă  l’utiliser en tant qu’outil pour votre suivi SEO !

L’analyse de logs : puissante mais encore peu rĂ©pandue

Avant de rentrer dans le vif du sujet, j’aimerais reprendre les mots de mon cher co-auteur Mathieu Chartier quant à l’importance de faire de l’analyse de logs.

Pourquoi je reprends l’avis de Mathieu et je ne donne pas le mien ? Tout simplement parce que dans le binĂŽme que nous sommes, c’est Mathieu qui prĂ©sente une expertise pour la technique et son avis sera plus pertinent que le mien.

De plus, Mathieu fait une introduction du sujet dans notre livre « Techniques de rĂ©fĂ©rencement web » (3e Ă©dition) qui sortira trĂšs trĂšs bientĂŽt (5 avril 😊 )

Allez, je vous laisse lire ses mots en guise de mise en bouche !

« L’analyse de logs est une pratique encore assez peu rĂ©pandue en matiĂšre de SEO, bien qu’elle prenne de plus en plus d’ampleur, et Ă  raison ! En effet, analyser les journaux de bord des serveurs (logs) permet d’auditer en continu un site web, de diagnostiquer de potentiels problĂšmes de rĂ©fĂ©rencement voire de gĂ©nĂ©rer des ajustements selon le comportement observĂ© sur la durĂ©e.

Le gros atout de l’analyse de logs, c’est qu’il n’y a pas de mensonges ici. Chaque action (« hit ») est notifiĂ©e sur le serveur et vous pouvez donc observer l’ensemble des actions effectuĂ©es sur le site web, bien au-delĂ  de ce que fournissent des outils comme la Google Search Console, Google Analytics ou mĂȘme certains outils SEO. Sans faire de promotion, sachez que l’excellent François Goube a co-fondĂ© OnCrawl par exemple, l’un des rares outils de qualitĂ© pour faire de l’analyse de logs (sans mettre les mains dans les journaux et faire des analyses fastidieuses et chronophages).

L’analyse de logs est une tendance Ă  suivre pour 2017, 2018 voire les annĂ©es Ă  venir. Il faudrait idĂ©alement que cela devienne mĂȘme une habitude, notamment pour les sites importants ou les gros projets. En effet, plus un site comptabilise de pages, plus le suivi minutieux des actions est complexe. Avec de telles analyses, il est possible de dĂ©terminer si les robots ne sont jamais venus visiter certaines pages d’un site par exemple (mĂȘme avec un sitemap.xml
), et donc chercher Ă  comprendre pourquoi ce phĂ©nomĂšne se produit. Il est aussi possible d’observer la vraie frĂ©quence de crawl de chaque bot, de suivre les pages ou ressources qui intĂ©ressent le plus les visiteurs (taux de visite ou d’ouverture d’une page ou d’un PDF par exemple
).

N’attendez plus pour y passer si vous possĂ©dez des sites relativement massifs, cela mettra trĂšs certainement en lumiĂšre des lacunes en rĂ©fĂ©rencement que vous n’osiez mĂȘme pas imaginer


Mathieu Chartier dans Les priorités SEO et tendances pour 2017 !

Qui est derriĂšre OnCrawl ?

OnCrawl a Ă©tĂ© fondĂ© par François Goube, serial entrepreneur, et Tanguy Moal, expert NLP et data geek. Maintenant, ils sont prĂšs de 20 personnes dans l’équipe Ă  contribuer jour aprĂšs jour Ă  l’amĂ©lioration constante de l’outil.

Un outil français donc, en concurrence directe avec Botify ou DeepCrawl.

OnCrawl continue son chemin de dĂ©veloppement en faisant notre fiertĂ© mĂȘme en dehors des frontiĂšres. L’outil s’est vu desservir le prix du meilleur outil en Pologne : « Best Search Software Tool at the European Search Awards ».

Pour finir, je vous invite Ă  lire l’interview de François Goube sur le blog, car elle est trĂšs intĂ©ressante. À mon avis, elle complĂ©tera bien cet article de prĂ©sentation. Avec François, on parle budget crawl, page importance et analyse de logs bien Ă©videmment 😊

Que fait OnCrawl : ses principales fonctionnalitĂ©s !

OnCrawl est un crawler sĂ©mantique en mode SaaS qui explore l’intĂ©gralitĂ© du contenu d’un site. TrĂšs simplement, cela veut dire que l’outil va crawler (visiter et analyser) toutes les pages de votre site et vous fournira des informations intĂ©ressantes sur l’indexation, le maillage interne/externe, la performance globale du site, l’architecture du site, le contenu
.

C’est aussi un analyseur de logs qui va permettre de comprendre comment Google se comporte sur chaque page d’un site.

Enfin, c’est aussi une data platform qui permet de croiser tout un jeu de donnĂ©es (logs, backlinks, analytics, csv, search console) avec les donnĂ©es de crawl pour comprendre leur impact sur le trafic naturel d’un site.

Aujourd’hui, nous allons parcourir les fonctionnalitĂ©s de crawl et de l’analyse de logs, pour ce qui est des analyses croisĂ©es, on verra dans un autre article si cela vous intĂ©resse – faites-le-moi savoir dans vos commentaires.

OnCrawl : Performant Crawler SEO

Indexability : l’indexation de votre site

Dans cette partie «indexation», l’outil nous fournit des informations sur nos pages : les pages crawlĂ©es, les pages qui sont indexĂ©es dans le moteur de recherche, les pages qui ne sont pas indexĂ©es et la raison (interdiction avec meta robots, interdiction via le robots.txt), les pages canoniques, le hreflang si le site est multilingues, un focus sur le sitemap et les Ă©ventuelles erreurs, et bien Ă©videment le code renvoyĂ© par chaque page avec zoom sur chaque code 2xx, 3xx, 4xx


Cette premiĂšre partie permet donc de vĂ©rifier si toutes pages qui mĂ©ritent d’ĂȘtre indexĂ©es sont indexĂ©es et si toutes les pages qui ne sont pas indexĂ©es doivent vraiment ne pas ĂȘtre indexĂ©es
 Bien Ă©videmment, certaines informations vous pouvez les avoir dans la Search Console, mais OnCrawl est beaucoup plus visuel, donc ça peut aider pour mieux comprendre les choses (tout dĂ©pend de votre niveau de connaissances).

Links Flow : le maillage interne

Cette partie se consacre aux liens internes (entrants et sortants). Il y a deux nouvelles notions qu’OnCrawl a imaginĂ© :

  • Le InRank – une sorte de PageRank interne. Cela permet de voir la popularitĂ© des pages en fonction de leur nombre entrant de liens internes, des ancres, du contenu dupliquĂ© et d’autres facteurs
  • Le Inrank Flow – la distribution de ce jus lien interne. Une visualisation de la distribution de la popularitĂ© interne.

Si vous avez en place un cocon sĂ©mantique sur votre site par exemple, cette partie sera d’une grande utilitĂ©. Analyser et suivre le LinksFlow d’OnCrawl, vous permettra de voir comment la popularitĂ© est distribuĂ©e d’un groupe de pages Ă  un autre et voir si certaines catĂ©gories sont favorisĂ©es ou non.

HTML tags : les balises HTML

Cette 3e analyse se consacre sur les Tags HTML :

  • Les Tags SEO : balise title, mĂ©ta description, hn, etc. Pour chaque tag, un zoom sur la qualitĂ© et la taille.
  • Les tags DonnĂ©es structurĂ©es (Schema.org) : le nombre de pages avec des donnĂ©es structurĂ©es, le type des donnĂ©es structurĂ©es.
  • Les Social Tags (Open Graph et Twitter Cards) : le nombre de pages ayant les balises open graph et twitter cards, le type de balise utilisĂ©.

Content : zoom sur le contenu

À l’heure actuelle, la force du contenu n’est plus Ă  dĂ©montrer. Prendre soin de son contenu est primordial pour une visibilitĂ© en ligne. OnCrawl a bien compris l’enjeu et l’analyse pour nous : le nombre moyen de mots par page, le ratio texte/code par page, le nombre de pages avec images, le nombre d’images avec l’attribut ALT manquant.

Duplicate content : gare aux contenus dupliqués

Le contenu dupliquĂ© est Ă  Ă©viter si vous ne voulez pas vous anĂ©antir le rĂ©fĂ©rencement. Quand on parle contenu du site, on parle bien Ă©videmment du contenu texte d’une page, d’un article, mais aussi des Ă©lĂ©ments structurels et balises : titre de l’article, balise title, mĂ©ta description, Hn, etc.

Payload : quand la vitesse compte

Le temps de chargement, la vitesse de votre site compte pour Google mais aussi pour vos utilisateurs. OnCrawl vous propose d’analyser le temps de chargement, mais aussi le poids de vos pages. Essayez de faire attention à ce critùre, il est primordial aujourd’hui. Les internautes n’ont plus de patience, et Google non plus 😊

Le Crawler OnCrawl vous permet donc de :

  • ContrĂŽler l’indexabilitĂ© de votre site : connaĂźtre les pages indexĂ©es, les pages non indexĂ©es, la performance de vos sitemaps, des informations relatives aux rel alternate comme les balises canoniques, la pagination et les balises hreflang.
  • Optimiser votre contenu : l’outil analyse la quantitĂ© et la qualitĂ© du contenu de vos pages, ainsi que le contenu dupliquĂ©, idĂ©al pour prendre en main l’optimisation des contenus.
  • Optimiser les performances du site : notamment le poids et le temps de chargement de chacune de vos pages, afin d’amĂ©liorer le budget crawl et l’expĂ©rience utilisateur par la mĂȘme occasion.  
  • Optimiser la structure interne : OnCrawl calcule l’Inrank (le pagerank interne) en Ă©valuant l’autoritĂ© d’une page et sa capacitĂ© Ă  redistribuer de la popularitĂ© en fonction du nombre d’inlinks, de sa profondeur et d’autres facteurs variĂ©s. IdĂ©al pour suivre l’architecture du site.

OnCrawl : Puissante Analyse de logs

Crawl Behavior : vision macro

Dans cette premiĂšre partie du log monitoring, nous avons une vue d’ensemble sur l’analyse et le travail de logs  : le nombre de pages crawlĂ©es, les bots hits (passages des bots), le web VS mobile bots hits, la frĂ©quence de crawl. 
 Cette partie permet d’avoir une vision macro sur l’état du crawl et de l’analyse de logs.

SEO Impact : des KPI SEO

Cette partie est plus qu’importante. Elle permet de voir les rĂ©sultats de l’analyse de logs avec un oeil SEO.

  • Les visites SEO, issues donc de l’organique (cette info nous pouvons l’avoir Ă©galement dans Analytics par exemple) mais promets d’ĂȘtre plus fiable. De plus, en organisant les pages par groupe nous serions en mesure de dire quelle catĂ©gorie de notre site est plus recherchĂ©e et consultĂ©e.
  • Les pages actives, c’est Ă  dire les pages qui ont apportĂ© au moins une visite au compteur.
  • Le SEO active ratio, c’est Ă  dire le pourcentages des pages qui apportent du trafic par rapport Ă  toutes les pages crawlĂ©es. Il faut avoir un ratio le plus important possible, signe que la plupart des pages du site apportent des visites.
  • Le FreshRank – un indicateur OnCrawl qui mesure le laps de temps nĂ©cessaire Ă  une page pour devenir active donc apporter du trafic.

Exploration sanity : l’état de santĂ© de l’analyse de logs

Dans cette derniĂšre partie de l’analyse de logs, vous avez des informations sur l’Ă©tat de santĂ© de l’analyse de logs, concernant les codes renvoyĂ©s aux bots par les pages crawlĂ©es, par les ressources crawlĂ©es, le nombre de ressources crawlĂ©es par type 


Enfin, l’ensemble des analyses croisĂ©es proposĂ©es permettent de comprendre l’influence des facteurs de positionnement (lien, contenu, performance
) sur la frĂ©quence de crawl de Google et les visites issues des moteurs de recherche.

Bien Ă©videmment, pour chaque grande famille d’informations, vous pouvez rentrer plus en profondeur et aller creuser en dĂ©tails les informations qui vous intĂ©ressent. L’outil est Ă  votre disposition pour mettre en Ă©vidence des Ă©lĂ©ments comme les points forts et les points faibles. Mais la valeur ajoutĂ©e de l’outil vous appartient ! C’est votre capacitĂ© d’analyse de ces datas et bien Ă©videmment, ce que vous faites de ces donnĂ©es qui comptera le plus ! Ainsi, prenez le temps de dĂ©chiffrer chaque information, vous trouverez des pĂ©pites d’or Ă  exploiter !

Quel intĂ©rĂȘt pour le SEO d’utiliser OnCrawl : 3 KPI intĂ©ressants !

Si François Goube nous donnait ses 5 KPI SEO indispensables Ă  surveiller avec OnCrawl dans son interview, ce serait : les visites organiques, le ratio de pages actives par groupes de pages, le ratio de crawl par groupes de pages, les pages orphelines actives, le contenu dupliqué  (vous trouverez les dĂ©tails dans l’interview). J’aimerais en ajouter 3 de plus Ă  cette petite liste.

  • Les pages pauvres en contenu : Google est un obsĂ©dĂ© textuel. Il faut lui donner du contenu pour qu’il vous aime. 😊  Attention donc aux pages pauvres en contenu : mĂ©ritent-elles d’exister et d’ĂȘtre indexĂ©es dans Google ?
  • Le ratio texte/code : on cherche Ă  ĂȘtre rapide et pertinent sĂ©mantiquement. Il faut donc avoir le moins de code possible pour mettre en avant les mots-clĂ©s, le contenu, et la sĂ©mantique de la page. Un code HTML lĂ©ger et bien construit sera donc privilĂ©giĂ©.
  • Le temps de rĂ©ponse : la vitesse du site est importante, signe des performances du site. Google ne veut afficher que des pages rapides (surtout avec l’Index First). Les utilisateurs veulent que la page qu’ils visitent se charge rapidement, si ce n’est pas le cas, ils la quittent tout simplement et reviennent sur Google : votre taux de rebond augmente te Rankbrain, peut dĂ©cider de la dĂ©classer.

Vive OnCrawl !

Je fais faire une conclusion trùs courte : il vous faut OnCrawl 🙂

Si vous prenez soin de votre site et si sa visibilitĂ© en ligne est vraiment une prioritĂ© pour vous, il faut suivre des mĂ©triques pour pouvoir optimiser davantage, accroĂźtre les performances du site, corriger les erreurs, ajuster votre stratĂ©gie en temps rĂ©el, ĂȘtre rĂ©actif aux changements du moteur.

OnCrawl vous aide un peu sur tous les plans. Avec les 450 mĂ©triques (crawl, log monitoring, seo impact, backlinks, social media..) qu’il analyse pour vous, je suis certaine que vous trouverez des pistes d’amĂ©lioration pour votre site.

Et si vous avez peur, car peut-ĂȘtre, comme moi, vous n’avez pas un profil technique et l’outil vous paraĂźt une « usine Ă  gaz »  Sachez que finalement c’est assez simple. Pour la partie crawl il n’y a quasiment rien Ă  paramĂ©trer et pour la partie log, il faut quelques connaissances, mais il existe des tutoriels en ligne pour vous aider, et si cela n’est pas suffisant sachez que l’équipe OnCrawl est lĂ  pour vous aider et vous guider.

Alors, tentez l’expĂ©rience, faites un essai gratuit et vous verrez par vous mĂȘme tout le potentiel de ce tool et les avantages que vous avez Ă  l’utiliser !

À trĂšs bientĂŽt pour la prĂ©sentation d’un autre tool. 🙂

Please wait...

Une rĂ©flexion au sujet de « OnCrawl, performant crawler & puissant outil d’analyse de logs »

  1. Wow super review trĂšs complĂšte, ça donne vraiment envie de tester. Avant on utilisait on script perso pour analyser les logs et suivre les stats de crawl mais on on utilise Botify qui marche plutĂŽt bien mais OnCrawl a l’air super intĂ©ressant, on va faire un essai ! Merci Alexandra pour ton retour !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

CommentLuv badge

Les liens des commentaires peuvent être libérés des nofollow.