Bonjour à tous. J’espère que vous avez passé un bon weekend.
Aujourd’hui j’accueille sur le blog François Goube, homme à plusieurs casquettes ! Je suis ravie, car cela faisait très longtemps que j’attendais cette occasion. : quel beau cadeau de fin d’année !
Au menu : une présentation du parcours professionnel de François, les ambitions et les motivations qui l’ont poussée à concevoir OnCrawl et dans toute logique, une présentation des fonctionnalités de ce puissant crawler !
Je tenais à remercier François, mais aussi toute l’équipe OnCrawl car celle-ci a été plusieurs fois à mon écoute, m’a soutenue et aidé à passer le cap à plusieurs reprises. Autre leur professionnalisme, une grande humanité règne dans leur milieu et c’est admirable ! Vous êtes géniaux, on vous aime !
Quant à vous, chers lecteurs, je vous souhaite une belle découverte et – même si je vais avoir d’autres occasions de le faire – je vous souhaite de belles fêtes de fin d’année ! Surveillez le blog, j’ai une surprise pour vous (elle ne devrait plus tarder 😉 !)
Questions sur François : l’Homme derrière OnCrawl 😊
Qui est François ?
Je suis le co-fondateur d’OnCrawl. Je suis tombé dans la marmite du web dès l’adolescence. Passionné par l’analyse sémantique et les moteurs de recherche, j’aime analyser les publications scientifiques de Google. Je suis également ce qu’on peut appeler un entrepreneur récidiviste, car j’ai fondé plusieurs entreprises toujours en activité et je suis activement investi dans l’écosystème startup.
Raconte-nous ton parcours professionnel
Diplômé de l’école Toulouse Business School, j’ai débuté mon parcours professionnel en tant que Business Developper pour une SSII puis Marketing Manager pour l’un des premiers media sur web et mobile, c’est à cette époque que je me suis beaucoup plongé dans le référencement naturel. Comme j’ai toujours été un fou de technologie, et que j’aimais comprendre comment fonctionnait un moteur de recherche, j’ai eu envie de fabriquer le mien.
Petit à petit, l’idée de ma première boite a germé. Il s’agit également d’une histoire de rencontre puisque c’est aussi grâce à la rencontre de mon associé de l’époque que j’ai pu me lancer dans ma première expérience entrepreneuriale : le moteur de recherche dédié à l’emploi JobiJoba. Par la suite, j’ai co-créé Propulseo, une société de conseil en référencement naturel puis Cogniteev, l’entreprise qui héberge le développement de l’outil OnCrawl.
Comment es-tu tombé dans la marmite du web ?
Du plus loin que je me souvienne, j’ai toujours eu un ordinateur à la maison. Gamin, je bricolais de la musique sur un Amiga et ado je me suis mis à jouer avec du code HTML.
Sur le plan pro, cela fait plus de 15 ans que je bosse dans ce que l’on appelle aujourd’hui le digital. Ma génération a vu le web apparaître et se transformer. J’ai toujours été fasciné par cette technologie et plus particulièrement par l’analyse sémantique qui s’est développée avec l’arrivée des moteurs de recherche. J’admets que je dois beaucoup aux pionniers du SEO. J’ai passé tellement de temps sur Webmaster World. Je me rappelle des années 2000 où je lâchais des lignes et des lignes de code dans des listes de mail liées au SEO. Les discussions challengeantes et les attitudes test-and-learn que la plupart des pionniers ont mis en avant m’ont permis de façonner mes compétences durant des années.
Énumère-nous trois choses dont tu es particulièrement fier !
Sur le plan professionnel, je suis très fier d’avoir réussi à développer un outil performant et fiable qui répond à un véritable besoin des SEOs en France et à l’étranger.
Ensuite, je suis fier d’avoir réalisé cela avec une équipe solide et talentueuse qui fait évoluer l’outil constamment et challenge les pré-requis de Google. Enfin, je suis fier de faire partie de la sphère des Startups Bordelaises, j’ai notamment été membre du comité de la French Tech Bordeaux. Une expérience très enrichissante !
Une quatrième en Bonus ? Je viens du sud-ouest, et je suis né au bord de l’océan. Je suis très fier de savoir ouvrir une huître en moins de 10 secondes 🙂
Qu’est-ce que t’aimes le plus et le moins dans ton métier ?
Ce que j’aime le plus dans mon métier c’est l’innovation constante. Notre environnement est en perpétuelle évolution, à mesure que les algorithmes de Google sortent et que la R&D se développe, notre métier se transforme. De plus, j’apprécie énormément de pouvoir travailler dans un milieu où je suis entouré de personnes compétentes et bienveillantes. Le SEO est un secteur très ouvert et basé sur le partage, une vraie chance !
Ce que j’aime le moins dans mon métier, c’est probablement lorsque Google décide de sortir des mises à jour importantes la veille de mes vacances !
À quoi rime une journée type de François ?
Les journées ne sont pas toujours identiques quand on travaille au sein d’une startup mais en général, après avoir épluché mes mails non lus, je fais un point avec les différentes équipes sur les avancements en cours, puis j’ai régulièrement des rendez-vous avec des clients ou des prospects et avec nos investisseurs. Et bien sûr, la gestion de l’entreprise occupe également une très grande partie de mes journées !
Des projets pour l’avenir ?
Le grand projet pour l’avenir est de faire d’OnCrawl un leader mondial dans le domaine du Technical SEO. Nous nous sommes récemment installés à Montréal, notre objectif est de poursuivre ce développement en Amérique du Nord, mais aussi en Europe.
Parallèlement, nous souhaitons évidemment continuer d’accompagner au mieux nos clients au quotidien et poursuivre la mise au point de nouvelles innovations pour OnCrawl. Nous avons d’ailleurs de belles nouveautés à venir.
Questions SEO Technique : prenez un paracétamol 🙂
Le budget de crawl : comment en tirer profit et surtout comment l’analyser ?
Chaque jour, Google analyse et parcourt des centaines de milliers de pages sur différents sites web. L’objectif est de déterminer quelles pages doivent être indexées dans les résultats de recherche et si elles sont indexées, quelles positions elles vont occuper : c’est ce qu’on appelle le crawl. Google configure quotidiennement une quantité de ressources dédiées au crawl d’un site web : c’est le « budget de crawl ». Cela signifie que plus Google vous attribue du budget de crawl, plus vos pages importantes ont de chances d’être bien positionnées dans les résultats de recherche.
Nous avons intégré cette notion dans OnCrawl afin de permettre à l’utilisateur d’analyser et de tirer profit de son budget de crawl grâce à des métriques révélatrices. En effet, pour pouvoir améliorer ce budget de crawl, il est important de comprendre comment se comporte le bot de Google sur un site. OnCrawl permet de repérer ce qui ralentit le crawl du bot (mauvais status codes, temps de chargement trop long, contenu dupliqué…). L’outil aide également à comprendre où le budget de crawl de Google est dépensé en surveillant le ratio de crawl par segment ou profondeur ou en déterminant quel facteur de classement influence le comportement du robot. Pour optimiser le budget de crawl qui est alloué, il faut pouvoir le suivre, le monitorer et l’améliorer !
Comportement du crawl sur 30 jours
Le « Page importance » : kesako et comment maximiser ?
La Page Importance est un algorithme qui détermine le score utilisé par Google pour classer les URLs à interroger lors des sessions de crawl, en se concentrant sur les plus importantes en premier. La page importance permet de dépiler les URLs prévues à explorer pour optimiser le budget de crawl affecté à chaque site. Afin de mieux répartir ses dépenses lors des crawls, Google doit prioriser les pages qu’il doit “fetcher”. Il est possible de maximiser sa Page Importance en :
- Optimisant le temps de chargement
- Optimisant le maillage interne
- Favorisant différents types de documents
- Maintenant des sitemap.xml à jour
- Réduisant les liens qui ne sont pas pertinents
- Optimisant les contenus et leur volume
L’analyse de logs : à quoi sert-elle et comment l’utiliser ?
Se servir d’une analyse de fichiers de log SEO est une solution pertinente et efficace pour améliorer le SEO technique et onsite. Les fichiers de logs sont les seules données à être 100% fiables pour comprendre parfaitement comment les moteurs de recherche crawlent votre site et pour avoir une vision exhaustive de l’environnement d’un site web.
Lorsque vous procédez à l’analyse de vos logs, je vous conseille de vous intéresser aux métriques suivantes afin d’optimiser au mieux votre référencement naturel :
- Les passages des robots de Google : on trouve dans les logs des informations sur la date, l’heure, les URLs que Google est venu parcourir sur un site. On est donc capable de suivre les bots à la trace.
- Le trafic referral : il est possible d’évaluer l’ensemble du trafic SEO d’un site web afin d’analyser la performance de ses pages en termes de trafic naturel.
- Croiser les données de crawl et de logs : cela permet d’identifier les zones du site que Google ignore ainsi que les zones que Google apprécie. Cette analyse croisée permet également de surveiller tout un ensemble de métriques pouvant avoir un impact sur la fréquence de crawl : le nombre de mots, la densité et la profondeur des liens internes, le contenu dupliqué, etc. Bref vous avez toutes les réponses pour savoir comment booster votre trafic SEO !
Quels KPi SEO importants OnCrawl peut-il nous aider à surveiller/optimiser ?
Parmi les 450 métriques qu’OnCrawl met à votre disposition, je pense qu’il faut impérativement surveiller les KPIs suivants :
- Les visites organiques : Le nombre de visites organiques (aussi connues sous le nom de visites SEO), dans un laps de temps donné, est un KPI important à surveiller et l’un des plus fondamentaux.
- Le ratio de pages actives par groupes de pages : Le ratio de pages actives vous indique non seulement la quantité de trafic SEO que vous recevez, mais également si celui-ci est dirigé vers les bonnes pages.
- Le ratio de crawl par groupes de pages: Votre ratio de crawl est un autre KPI sur lequel vous devriez vous concentrer. Afin de générer du trafic et des conversions, il est important de vous assurer que les pages les plus importantes d’un site sont fréquemment crawlées par Google.
- Les pages orphelines actives : Le ratio de pages orphelines actives est un autre KPI du SEO technique à surveiller. Pourquoi ? Parce que ces pages peuvent être très rentables si elles sont rattachées à la structure. Une page orpheline active signifie car génère du trafic organique, mais qu’elle n’est pas rattachée à la structure de lien interne.
- Le contenu dupliqué : Le contenu dupliqué ou similaire est un autre KPI SEO à prendre au sérieux. Le contenu dupliqué interne est considéré comme de mauvaise qualité par Google et peut nuire à votre ratio de crawl.
Questions OnCrawl : le MUST des crawlers SEO
Quelles ont été les motivations qui t’ont poussée à la conception de cet outil ?
OnCrawl est né d’un consortium industriel monté en 2013 avec Cdiscount. Ce géant du e-commerce était à la recherche d’un outil permettant d’obtenir des données fiables à propos de son site. Nous avons donc construit cet outil en répondant aux exigences du plus gros site d’e-commerce français. À force de travail en R&D et de partenariats avec des entreprises comme Myposeo, Majestic ou AT Internet, nous sommes parvenus à construire une solution qui permet de piloter les métriques nécessaires à l’optimisation de sa stratégie SEO.
Quel est l’objectif d’OnCrawl ?
Difficile de ne garder qu’un seul objectif ! Si je devais résumer les différents objectifs d’OnCrawl, voici les trois principaux axes que je retiendrais :
- Proposer les données les plus fiables et exhaustives pour son SEO
- Offrir du support et de l’accompagnement assuré par des experts SEO
- Garantir des analyses rapides et scalables
Présente-nous OnCrawl.
Quelles solutions l’outil propose-t-il ?
OnCrawl est avant tout un crawler SEO, c’est-à-dire un robot qui explore les pages d’un site web et qui en relève le code afin de comprendre le comportement de Google sur les différentes pages de son site web.
Ensuite, nous proposons un analyseur de logs SEO dédié au monitoring des robots d’indexation. Cette solution permet aux utilisateurs de mettre en place les bonnes actions afin de contrôler le comportement des robots de Google.
Pour tirer profit de ces deux fonctionnalités, OnCrawl propose de réaliser des rapports Crawl x Logs, donc de croiser ces données afin d’identifier les paramètres négatifs et positifs derrière l’indexation et la fréquence de crawl.
Enfin, OnCrawl c’est aussi une data platform qui permet de brancher plusieurs jeux de données pour comprendre leur influence sur les performances SEO.
Quels usages pouvons-nous en faire ?
Grâce à nos différentes solutions, vous pouvez mettre le doigt sur les principaux facteurs influençant vos positions à l’aide de dashboards personnalisables et exportables. L’objectif principal est d’analyser précisément ces métriques afin par exemple de détecter les pages qui répondent en 404, les pages orphelines, les temps de chargement trop long, les contenus dupliqués… En résumé, vous utilisez OnCrawl pour souligner les points qui impactent négativement votre site web afin de les corriger et d’améliorer votre SEO.
En quoi OnCrawl est-il différent des autres outils similaires du marché comme Botify ou DeepCrawl… ?
La concurrence est rude mais il faut admettre que chacun de ces outils dispose de ses avantages ! Pour notre part, je pense qu’OnCrawl se différencie par sa capacité à combiner un crawler, à un analyseur de logs et des sets de données tierces (Majestic, GSC, Rankings, Données issues de CRM…).
Nous avons d’excellents retours de nos utilisateurs sur notre capacité à crawler rapidement d’importants volumes de données (300 URLs/seconde) et sur les fonctionnalités que nous proposons.
Nous travaillons avec plus de 500 clients dont une majorité du top 20 e-commerce et media en France. Nous avons également été les premiers à développer l’Inrank, un page rank interne, ainsi qu’un Détecteur de contenus en “Near Duplicate”. Nous avons aussi fait de gros efforts pour proposer une expérience utilisateur fluide et agréable. De plus, notre expertise 100 % SEO et Sémantique nous permet de proposer une équipe de support performante et réactive.
Quand on parle OnCrawl on pense usine à gaz… est-il simple d’utilisation ? A qui s’adresse-t-il ?
C’est une erreur, la plupart de nos clients s’y connectent tous les jours. Si c’était “Usine à gaz”, ce ne serait pas le cas. Notre plateforme propose en effet des centaines de métriques. Mais nous avons fait en sorte de rendre l’outil accessible et simple d’utilisation. Cela signifie que nos clients peuvent paramétrer leur compte selon leurs besoins et objectifs métiers. Les dashboards peuvent être personnalisables et des systèmes de filtres permettent de se concentrer sur des zones précises de son site.
Notre objectif est de rendre la data accessible à un public large. Cela passe par notre politique de prix accessibles par rapport au marché, mais aussi par une UX et des dashboards qui permettent de comprendre facilement les données. Cependant, notre outil est aussi destiné aux experts SEO plus avancés via des fonctionnalités un peu plus techniques telles que le Data Explorer et ses filtres ou les possibilités de segmentations, de scraping et d’utilisation de nos APIs.
La V 3.0 vient tout juste de sortir : quelles sont les nouvelles fonctionnalités ?
On très fier de cette nouvelle version sur laquelle nous avons travaillé durant plusieurs mois ! Parmi les nouvelles fonctionnalités, nous avons ajouté les logs à tous nos plans (des plans ne comprenant que le crawl sont bien évidemment toujours disponibles) afin de rendre accessible cette fonctionnalité à tous nos utilisateurs.
Nous avons également retravaillé l’UX pour une meilleure navigation, près de 100 métriques et de nouveaux dashboards ont été ajoutés. Nous avons aussi retravaillé notre Data Explorer qui permet maintenant de construire des requêtes particulières pour n’importe quel jeu de données.
L’une des nouvelles fonctionnalités importantes est l’InRank Flow ; une visualisation des données qui vous aide à prédire comment votre popularité circule à l’intérieur de votre site web et à travers vos différents groupes de pages.
Enfin, OnCrawl devient une plateforme ouverte de données : vous pouvez maintenant ajouter n’importe quelle source de données grâce à nos APIs ou à des connecteurs déjà établis.
D’ailleurs, j’ai une petite surprise pour les lecteurs de Miss SEO Girl : 30% de réduction sur n’importe quel plan d’un mois incluant les logs avec le code MISSSEOGIRL30 valable jusqu’au 15 janvier.
Passionnée par le référencement naturel et la rédaction web ! Blogueuse depuis 2012 ! Coauteur du livre “Techniques de référencement web” et “Stratégie de contenu e-commerce”.
Découvrez mes “Prestations SEO” et contactez-moi pour échanger sur votre projet SEO.
Des précisions plus qu’utiles en matière de référencement et d’optimisation de site surtout l’usage de cette plateforme.
30% c’est généreux! heureuse d’être une lectrice de Miss SEO 🙂
Eden de capresilience.fr
J’ai découvert OnCrawl il y a peu de temps avant j’utilisais Watussi. Ma préférence va pour l’outil de François qui correspond mieux à mes besoins. Je vous conseille de tester en plus vous pouvez profiter de la promo d’Alexandra !