Sélectionner une page

Le sitemap XML est un outil SEO très intéréssant, encore faut-il l’utiliser correctement. Je ne compte plus le nombre de fois en faisant des audits, j’ai découvert des sitemaps XML complètement abandonnés, demandant à Googlebot d’indexer les pages vides ou en 404.

Ce tutoriel vous montrera comment vérifier, en quelques minutes avec R’, les sitemaps XML d’un site Internet. Vous pouvez l’utiliser pour vérifier les plans de site des concurrents aussi 😏

Comment vérifier les sitemaps XML avec R’ ?

1. Instructions pour installer le package

2. Trouver et vérifier les sitemaps xml

Ensuite, avec cette simple instruction, nous allons rechercher les URLs des sitemaps XML et les parcourir.

Ceci produira un ‘data frame’ avec toutes les informations extraites. Cela fonctionne aussi pour les sitemaps XML d’index.

3. (facultatif) Vérifier les URL soumises

Cette autre fonction intéressante vous permet de parcourir les URLs du sitemap.
Vous serez ainsi en mesure de vérifier si vos pages Web envoient bien des codes HTTP 200.

Attention, cela peut prendre un certain temps selon le nombre d’URL. Cela a pris plusieurs heures pour https://www.gov.uk/ par exemple.

Ensuite, vous pouvez analyser les données dans R’ ou télécharger un CSV si besoin pour vos analyses SEO et croisement de données.

 

Video demo

 

 

Any bug/feature

Si vous rencontrez un bug ou si vous souhaitez suggérer une amélioration, rendez-vous sur https://github.com/pixgarden/xsitemap