Analyse des liens vers votre site des Outils Google pour les webmasters avec Scrapebox

Google Webmaster Tools (GWT) permet de lister les liens externes pointant sur un site internet.

Le 12/09/2013 Google a annoncée une modification sur cet outil (voir ici http://googlewebmastercentral.blogspot.fr/2013/09/better-backlink-data-for-site-owners.html) :

  • auparavant il était possible de télécharger jusqu’à 100 000 backlinks. Mais ces liens étant classés par ordre alphabétique, la liste n’était pas forcement exhaustive.
  • Google propose maintenant plusieurs boutons pour télécharger les backlinks au format CSV ou Google docs.

Mais comme bien souvent avec Google Webmaster Tools les choses ne sont pas aussi simples qu’elles le semblent, et il y a une certaine incohérence entre les différentes informations.

Nous allons travailler sur l’annuaire www.annuaire-habitat.eu et tenter de récupérer un maximum de liens avec GWT. Pour cela nous allons utiliser ScrapeBox pour manipuler les fichiers téléchargés sur GWT.

 L’INTERFACE DE Google Webmaster Tools : 


GWT annonce 109 968 liens vers votre site (chiffre du 13/12/2013). Nous allons tenter de récupérer un maximum de backlink.

En cliquant sur « Plus >> » de la partie « Qui référence le plus votre site par le biais de liens » (1) on arrive sur cet écran:

En cliquant sur « Télécharger ce tableau » on récupère au format CSV , la liste des domaines , le nombre de liens par pages et le nombre de page référencées

Le fichier comporte bien 113 lignes, mais si on additionne le nombre de liens de chaque domaine on arrive à 52 988 backlinks et non pas 109 968.

 NOTA: dans cet exemple si on clique sur « Plus >> » de la partie « Votre contenu le plus référencé par le biais de liens » , le bouton « Télécharger ce tableau » récupère un fichier au format CSV qui nous donne un total de 109 419 !

On va utiliser les 2 autres boutons « Télécharger d’autres exemples de liens » et « Télécharger les derniers liens » pour récupérer 2 listes de backlinks au format CSV.

NOTA: pas la peine de faire ces opérations sur la partie « Votre contenu le plus référencé par le biais de liens » et la partie « Qui référence le plus votre site par le biais de liens » , car on obtient les mêmes fichiers.

Dans notre cas, chaque fichier recense 1976 backlinks pointant sur l’annuaire.

Pour le fichier obtenu en cliquant sur « Télécharger d’autres exemples de liens », il faut supprimer la premières lignes de ce fichiers et l’enregistrer en fichier texte .txt pour ScrapeBox en le renommant en :

  • GWT-domains-other-annuaire-habitat.txt

Pour le fichier obtenu en cliquant sur « Télécharger les derniers liens » , il faut manipluer le fichier dans Excel et récupérer la 1ere colonne et l’enregistrer en fichier texte .txt pour ScrapeBox en le renommant en :

  • GWT-domains-lastlinks-annuaire-habitat.txt

On va fusionner les 2 fichiers et dédoublonner les URL avec ScrapeBox:

 

Le 1er fichier sera chargé avec « Import and replace current list » le second avec « Import and add to current list ».

Les doublons seront supprimé via le « remove filter » : « Remove duplicate URL’s »


On obtient finalement 1985 liens pointant vers l’annuaire. Ce qui est bien loin des 109 968 backlinks annoncés par Google !

On transfert ces 1985 URL dans le Check links de ScrapeBox via « Transfer URL’s to Blog List to Check Links »

On peut alors suivre les opérations décrites précédemment ici.

Une réflexion au sujet de « Analyse des liens vers votre site des Outils Google pour les webmasters avec Scrapebox »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>