Comment récupérer ses backlinks ou ceux de la concurrence avec SCRAPEBOX

Pour récolter les backlinks via ScrapeBox, il faut utiliser le module (« addons ») : ScrapeBox Backlink Checker.

Nous allons prendre comme exemple l’analyse des liens pointant sur l’annuaire : www.annuaire-habitat.eu.

ScrapeBox : addon list

Ce module vous permet de télécharger jusqu’à 1000 liens externes selon le descriptif du module.

La version actuelle (au 13 novembre 2013) est ScrapeBox Backlink Checker 2.0.0.4.

Cette version utilise les données de SEO MOZ mozscape data.

Les anciennes versions utilisaient (dans l’ordre chronologique) :

  • le backlink checker de Yahoo (Yahoo Site Explorer) qui a stoppé en Novembre 2011.
  • Le service backlink d’ALEXA qui est devenu payant

 

CONFIGURATION DU MODULE ScrapeBox Backlink Checker :

L’écran de ce module est relativement simple :

ScrapeBox : backlink checker

Il faut tout d’abord configurer le compte avec les données de SeoMoz API via le bouton »Account Setup »(1)

ScrapeBox : Ecran backlink checker configuration

Pour cela il faut cliquer sur »Click here to register API key »(1)

On arrive sur la page du site SeoMoz API : http://moz.com/products/api/keys .

L’inscription est très simple a réaliser.

 Attention !! :

- la syntaxe proposé par le module est fausse et génère un message d’erreur Scrapebox Backlink Checker 2 : »error fetching »

Il faut rentrer les paramètres sous la forme : Access-ID|SecretKey|proxy-ip:port (2)

 Ex :
member-4421c50af3|a7120a4b4216587bfda3faf15a8f769e|12.199.152.329:80

- Il faut avoir accès à un serveur Proxy (il est impératif de toutes façons d’avoir 1 ou plusieurs serveurs Proxy pour utiliser correctement ScrapeBox. Pour configurer Ipcop, par exemple, en serveur Proxy voir ici).

 UTILISATION ADDON ScrapeBox Backlink Checker :

Une fois votre configuration terminée, vous pouvez utiliser le module »Backlink Checker »

Pour cela créer un fichier texte url.txt comportant une ou plusieurs URL et charger le dans le module via le bouton »Load url List ».

Puis cliquer sur le bouton »Start ».

L’écran ci-dessous montre le scrapping des liens externes de 2 sites.

On notera que le Addon fait bien des pauses de 10 secondes car j’utilise la version Free de Mozscape API (3).

ScrapeBox : backlink checker running

A la fin de la récolte des liens pointant sur le(s) site(s) il faut enregistrer le résultat via le bouton »Save backlink »au format texte ANSI (par exemple : BL-annuaire-habitat.txt).

 NETTOYAGE DES RESULTATS DE LA RECUPERATION DES LIENS EXTERNES :

Il faut maintenant tester si ces liens externes vers votre site sont toujours d’actualités (les données de SeoMoz ne sont pas forcement à jour).

Pour cela on va utiliser la fonction »Check link »de ScrapeBox.

Dans »Comment Poster »de ScrapeBox cliquer sur »Check Links »(1)

Dans »Websites »charger votre fichier url.txt (2)

Dans »Blog Lists »charger le fichier des Backlinks : BL-annuaire-habitat.txt (3)

ScrapeBox : check baclinks

Ensuite on clique sur »Check links ». Il est conseillé de mettre l’option »Delay »à »OFF ».

La vérification des 289 liens se fait en moins de 2 minutes.

ScrapeBox trouve 151 liens valides sur les 289 backlinks :

On trouve les informations suivantes :

  • Le lien sortant (Anchor Link) .
  • Le texte cliquable (anchor text).
  • La taille de la page WEB. Intéressant car des pages lourdes à charger sont généralement pénalisées par Google. (mais on ne peut pas récupérer cette information via l’export).
  • Le statut de la page (on trouve par exemple des erreurs HTTP 500 qui semble être un bug de ScrapeBox, car ces pages sont bien actives ?? ). 

ScrapeBox : check backlinks results

On va exporter ce résultat sous 2 formes :

 ScrapeBox : export backlinks

  • en fichier texte .txt via »Export links found »avec le nom : BL-OK-annuaire-habitat.txt .
  • en fichier Excel via »Export links found as Excel file »avec le nom : BL-OK-annuaire-habitat.xlsx .

Le fichier texte va nous permettre de vérifier les PR (Page Rank) des pages comportant des liens externes vers le site www.annuaire-habitat.eu.

Dans le bloc »Manage Lists » on va importer le fichier BL-OK-annuaire-habitat.txt via le bouton »Import URL List »

ScrapeBox : import URL list

Ensuite on va récupérer les PR de chaque page via le bouton »Check PageRank »:

ScrapeBox : check PageRank

On exporte ensuite le résultat au format Excel sous le nom : : BL-OK-PR-annuaire-habitat.xlsx

En mixant les 2 fichiers dans Excel (BL-OK-annuaire-habitat.xlsx et BL-OK-PR-annuaire-habitat.xlsx ) on obtiendra un résultat détaillé des Backlinks .

ScrapeBox : manage list

A noter le bouton »Show Statistics »qui permet d’avoir le détail du nombre de liens par PageRank Google.

ScrapeBox : Google PR statistics

 

Analyse des résultats de la récupération des backlinks  :

Ce travail a permis de mettre en valeur les points suivants sur les backlinks de l’annuaire :

  • backlink douteux :
    • On trouve quelques liens avec des ancres sans rapport avec le sujet de l’annuaire. Ces liens feront l’objet d’une demande de suppression dans l’outil de désaveu de lien Google.
  • Page de destination toujours la même + Ancre de liens pas assez variées :
    • Le netlinking de l’annuaire habitat n’est pas conforme avec les préconisations de Google. Par exemple la requête sur »annuaire habitat »a énormément souffert de la mise à jour Google Penguin 2.1 du 4 octobre 2013 (passage de la position 5 à la position 78)

 

Conclusion sur le module ScrapeBox Backlink Checker :

 Les plus :

  • rapidité du scrapping.

 Les moins :

  • Complexité des opérations (mais certaines étapes sont automatisables via le module payant ScrapeBox Automator).
  • La limite des 1000 liens externes.
  • Le manque de statistiques sur les anchors text.
  • Des bugs dans la vérification des backlinks (erreur http et anchor text non trouvé).

 Sources :

Scrabox official

ScrapeBox official Website :
http://www.scrapebox.com/

Vidéo en anglais sur Scrapebox Backlink Checker 2 :
http://www.youtube.com/watch?v=UBtfOkZWyVA

Désavouer des backlinks dans Google Webmaster Tools:
http://www.webrankinfo.com/dossiers/gwt/refuser-backlinks


2 réflexions au sujet de « Comment récupérer ses backlinks ou ceux de la concurrence avec SCRAPEBOX »

  1. je reconnais que SCRAPEBOX est l’un des outils SEO les plus intéressant surtout qu’il permet de trouver des blog Dofollow de haute qualité et rapidement.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>