
Depuis quelques mois, j’utilise beaucoup Google Apps Script. Pour ceux qui savent pas encore de quoi il s’agit, c’est un langage de script du « cloud » de Google, très proche du Javascript, qui permet de faire communiquer différents services de Google entre eux, mais aussi avec des applications tiers et toutes sortes d’API externes.
Bref, cela permet d’imaginer pas mal de choses sympas surtout quand on a l’esprit tordu, avec ce couteau suisse géant, made in Google. Continuer la lecture de « Créer des liens? Merci Google Docs, mon nouvel outil de spamco »
Netlinking, Google et targets: Scrapons peu mais scrapons bien
Lorsque vous scrappez les pages de résultats de Google dans le but de trouver des cibles potentielles pour vos campagnes de netlinking, il ne ressort souvent que très peu d’URLs potables sur un grand nombre d’URLs récupérées.
Séprarer le bon grain de l’ivraie pour peu de rendement au final, les grosses moissons d’URL demandent des ressources et surtout des proxys pour eviter de tomber dans les captchas…
Continuer la lecture de « Netlinking, Google et targets: Scrapons peu mais scrapons bien »
Analyse du crawl de Googlebot avec la Watussi Box
Je tenais à vous présenter une application open-source développé par Jean-Benoît Moingt aka Mr Watussi (très bon blog SEO orienté technique/PHP/logs/Apache) qui va vous permettre de suivre le crawl de GoogleBot sur vos sites, via une interface Web et sans avoir à aller trifouiller les logs en ligne de commande Continuer la lecture de « Analyse du crawl de Googlebot avec la Watussi Box »
Les en-têtes HTTP ou comment maîtriser son indexation sur Google
Voici un petit article sur l’en-tête X-Robot-Tag et l’en-tête Link rel=canonical.
X-Robot-Tag pour simplifier, c’est l’équivalent de la meta <meta name= »robots »> (que vous pouvez placer dans le code source de vos pages HTML) mais dans les en-têtes HTTP, de même pour la Canonical.
Cette méthode présente de nombreux avantages, c’est une solution rapide et efficace à mettre en oeuvre: quelques lignes dans votre configuration d’Apache ou .htaccess. Continuer la lecture de « Les en-têtes HTTP ou comment maîtriser son indexation sur Google »
Modpagespeed ou l’ennemi potentiel de Google Images
ModPageSpeed est un module du serveur Apache développé par les équipes de Google dans le but est d’accélérer votre site, via un nombre assez impressionnant de filtres et fonctions dont la compression d’images à la volée.
Je compte faire un article détaillé à ce sujet prochainement sur ses fonctionnalités et son intérêt inutilité mais je n’ai pas résisté à l’envie de partager avec vous ce que je viens de remarquer: Modpagespeed tire une balle dans les pieds de Googlebot-Image quand vous le désactivez! Continuer la lecture de « Modpagespeed ou l’ennemi potentiel de Google Images »
Protéger votre blog d’un blast réalisé via des proxys anonymes
L’un des blogs que j’héberge sur un serveur dédié été victime d’un blast bien sévère (ou mal paramétré?) hier soir…
Plusieurs tentatives de commentaires par seconde via la méthode POST, je vous laisse deviner la suite: un plantage du serveur Apache qui n’a pas tenu la charge, les requêtes en POST n’étant pas mises en cache par Varnish.
Voici comment j’ai pu bloquer l’attaque (pour que mon Apache ne soit pas cassé – cf photo). Continuer la lecture de « Protéger votre blog d’un blast réalisé via des proxys anonymes »
Whatweb, un détective de sites Web SEO Friendly
Voici un petit article rapide pour vous faire part d’une découverte concernant un outil très pratique pour extraire de nombreuses infos concernant les sites Web: WhatWeb.
A la manière de Chrome Sniffer, ce programme va vous permettre de connaitre plusieurs infos sur un site web: CMS utilisé, Framework, librairies JS… mais il va surtout vous permettre d’aller beaucoup plus loin! Continuer la lecture de « Whatweb, un détective de sites Web SEO Friendly »
Plus de problèmes de guillemets français sous WordPress

Les guillemets, sur WordPress.
Vous avez un blog sous WordPress, vous rédigez un article et à la publication, surprise!
Une simple expression entre guillemets et WordPress vous transforme automatiquement vos « en guillemets français « (ouvrant) et » (fermant).
Vous n’aviez jamais remarqué? Continuer la lecture de « Plus de problèmes de guillemets français sous WordPress »
Lors d’une migration SEO, n’oubliez aucune URL pour vos redirections
Comme vous le savez (ou pas), il est capital de rediriger l’ensemble des URL d’un site lors d’une refonte avec des redirections 301 afin de redistribuer la popularité des pages/site vers le nouveau site.
Ayant fait des recommandations pour plusieurs migrations SEO concernant les sites de deux clients récemment, je tenais à partager avec vous quelques éléments qui me semblent indispensables afin d’éviter toute chute de trafic. Continuer la lecture de « Lors d’une migration SEO, n’oubliez aucune URL pour vos redirections »
Vérifier les liens cassés sur une page avec Google Docs
Ayant découvert depuis peu Google Apps Scripts qui permet de faire interagir les différentes API Google via un langage assez similaire au Javascript, je tenais à partager avec vous un petit script trouvé sur un autre blog qui permet de vérifier le status HTTP d’une liste d’URL.
Cet article est plus un POC (« Proof of Concept ») qu’autre chose, afin d’éveiller votre esprit sur les possibilités de Google Docs & Google Apps Script Continuer la lecture de « Vérifier les liens cassés sur une page avec Google Docs »