10 contrôles clés pour évaluer l'hygiène du ramper

10 contrôles clés pour évaluer l'hygiène du ramper

Lors de l'optimisation de l'exploration de nos sites Web, notre objectif principal est de nous assurer que les moteurs de recherche passent leur temps sur nos pages les plus importantes afin qu'ils soient régulièrement explorés et que tout nouveau contenu puisse être trouvé.

Chaque fois que Googlebot visite votre site Web, sa fenêtre est limitée pour explorer et découvrir autant de pages et de liens que possible sur votre site. Lorsque cette limite est atteinte, elle s'arrête.

Le temps nécessaire pour que vos pages soient revues dépend d'un certain nombre de facteurs différents qui jouent sur la façon dont Google priorise les URL pour l'exploration, notamment:

  • PageRank.
  • Inclusion de plan de site XML.
  • Position dans l'architecture du site.
  • À quelle fréquence la page change.
  • Et plus encore.

En fin de compte, votre site n'attire l'attention de Googlebot que pendant une durée limitée à chaque exploration, ce qui peut être peu fréquent. Assurez-vous que le temps est dépensé judicieusement.

Il peut être difficile de savoir par où commencer lors de l'analyse de l'optimisation de votre site pour les robots des moteurs de recherche, en particulier lorsque vous travaillez sur un grand site avec beaucoup de URL à analyser ou travailler dans une grande entreprise avec de nombreuses priorités concurrentes et des correctifs SEO exceptionnels à hiérarchiser.

C'est pourquoi j'ai dressé cette liste de contrôles de haut niveau pour évaluer l'hygiène de l'analyse à donner vous un point de départ pour votre analyse.

1. Combien de pages sont indexées par rapport au nombre de pages indexables sur le site?

Pourquoi c'est important

Cela vous montre combien de pages sur votre site sont disponibles pour Google pour index, et combien de ces pages Google a pu réellement trouver et combien elles ont déterminé étaient suffisamment importantes pour être indexées.

10 contrôles clés pour évaluer l'hygiène du ramper

10 contrôles clés pour évaluer l'hygiène du ramper

2. Combien de pages sont explorées dans l'ensemble?

Pourquoi c'est important

La comparaison de l'activité d'exploration de Googlebot avec le nombre de pages que vous avez sur votre site peut vous donner un aperçu du nombre de pages que Google soit ne peut pas accéder à, ou a déterminé qu'il n'y a pas suffisamment de priorité pour planifier une analyse régulière.

10 contrôles clés pour évaluer l'hygiène du ramper

10 contrôles clés pour évaluer l'hygiène du ramper

3. Combien de pages ne sont pas indexables?

Pourquoi c'est important

Passer du temps à analyser des pages non indexables n'est pas la meilleure utilisation du budget d'exploration de Google. Vérifiez combien de ces pages sont explorées et si l'une d'entre elles doit ou non être disponible pour l'indexation.

10 contrôles clés pour évaluer l'hygiène du ramper

4. Combien d'URL ne peuvent pas être explorées?

Pourquoi c'est important

Cela vous montrerau combien de pages vous empêchez les moteurs de recherche d'accéder à votre site. Il est important de s'assurer que ces pages ne sont pas importantes pour l'indexation ou pour découvrir d'autres pages à explorer.

10 contrôles clés pour évaluer l'hygiène du ramper

5. Combien de pages à faible valeur sont indexées?

Pourquoi c'est important

La recherche des pages que Google a déjà indexées sur votre site donne une indication dans les zones du site que le le robot d'exploration a pu y accéder.

Par exemple, il peut s'agir de pages que vous n'avez pas incluses dans vos sitemaps car elles sont de faible qualité, mais elles ont quand même été trouvées et indexées.

10 contrôles clés pour évaluer l'hygiène du ramper

6. Combien de pages d'erreur 4xx sont explorées?

Pourquoi c'est important

Il est important de s'assurer que le budget d'exploration n'est pas utilisé sur les pages d'erreur au lieu des pages souhaitées pour avoir indexé.

Googlebot essaiera périodiquement d'analyser 404 pages d'erreur pour voir si la page est de nouveau active, alors assurez-vous d'utiliser correctement 410 codes d'état pour montrer que les pages ont disparu et n'ont pas besoin de être réexploré.

10 contrôles clés pour évaluer l'hygiène du ramper

7. Combien de redirections internes sont explorées?

Pourquoi c'est important

Chaque demande que Googlebot fait sur un site utilise un budget d'exploration, et cela inclut toutes les demandes supplémentaires à chacune des étapes d'une chaîne de redirection.

Aidez Google à explorer plus efficacement et à conserver le budget d'exploration en vous assurant que seules les pages avec 200 codes d'état sont liés à votre site et réduisent le nombre de demandes effectuées vers des pages qui ne sont pas des URL de destination finale.

10 contrôles clés pour évaluer l'hygiène du ramper

8. Combien de pages canoniques sont Il par rapport aux pages canonisées?

Pourquoi c'est important

Le nombre de pages canonisées sur votre site donne une indication sur le nombre de doublons sur votre site. Bien que les balises canoniques consolident l'équité des liens entre des ensembles de pages en double, elles n'aident pas à analyser le budget.

Google choisira d'indexer une page sur un ensemble de pages canonisées, mais pour pouvoir décider laquelle est la page principale, il devra d'abord les explorer tous.

10 contrôles clés pour évaluer l'hygiène du ramper

9. Combien de pages paginées ou à facettes sont explorées?

Pourquoi c'est important

Google a seulement besoin d'analyser les pages qui contiennent du contenu non découvert ou des URL non liées.

La pagination et les facettes sont généralement une source d'URL en double et de pièges à robots, alors assurez-vous que ces pages qui n'incluent pas de contenu ou de liens uniques ne sont pas being exploré inutilement.

Comme rel = next et rel = prev ne sont plus pris en charge par Google, assurez-vous que votre lien interne est optimisé pour réduire la dépendance à la pagination pour la découverte de pages.

10 contrôles clés pour évaluer l'hygiène du ramper

10. Existe-t-il des incohérences dans la découverte de page entre les sources d'exploration?

Pourquoi est-ce important?

Si vous voyez des pages auxquelles les utilisateurs accèdent via vos données analytiques qui ne sont pas explorées par la recherche moteurs dans les données de votre fichier journal, cela peut être dû au fait que ces pages ne sont pas aussi détectables pour les moteurs de recherche que pour les utilisateurs.

En intégrant différentes sources de données à vos données d'exploration, vous pouvez repérer les lacunes là où les pages ne sont pas faciles à trouver par les moteurs de recherche.

Les deux principales sources de découverte d'URL de Google sont les liens externes et les plans de site XML. Par conséquent, si vous rencontrez des difficultés pour que Google explore vos pages, assurez-vous qu'elles sont incluses. dans votre sitemap s'ils ne sont pas encore liés à d'autres sites que Google connaît déjà et explore régulièrement.

10 contrôles clés pour évaluer l'hygiène du ramper

Pour résumer

En effectuant ces 10 vérifications pour vos sites Web que vous gérez, vous devriez être en mesure de mieux comprendre l'explorabilité et la santé technique globale d'un site.

Une fois que vous avez identifié les zones de déchets d'exploration, vous pouvez demander à Google d'explorer moins de ces pages en utilisant des méthodes telles que leur interdiction dans robots.txt.

Vous pouvez ensuite démarrer influencing pour explorer davantage vos pages importantes en optimisant l'architecture et les liens internes de votre site pour les rendre plus visibles et plus visibles.

Plus de ressources:

  • Comment les moteurs de recherche explorent et indexent: tout ce que vous devez savoir
  • SEO avant tout: un guide en 12 étapes à suivre avant d'explorer
  • SEO technique avancé: un guide complet

Crédits d'image

Toutes les captures d'écran prises par l'auteur, septembre 2019