Google Analytics est un service offert aux propriétaires de sites, de boutiques en ligne, de blogs, leur permettant d'obtenir des statistiques de fréquentation fines et sans efforts.
Le problème est que ce service prend une telle ampleur que la majorité des sites que vous visitez utilisez ce système, faisant grossir la base de donnée de Google sur vos habitudes sur la toile.
Ce petit article n'a d'autre prétention que vous expliquer comme ce système marche et surtout comment le désactiver.
Alors, connaissez-vous Google Analytics ? Non ? Et pourtant lui, vous connaît, et vous connaît plutôt bien même...
Pour résumer, il s'agit d'un système d'analyse des visites mise en place par Google il y a quelques années qui offre gratuitement à tout webmaster la possibilité de connaître de manière précise les statistiques de fréquentation de son site. Pour en bénéficier, il lui suffit d'insérer quelques lignes de html invisible au visiteur en bas de chaque page. Ca sonne assez sympa au fond, non ?
Mais le revers de la médaille est que le succès de GA est tel que la majorité des sites que vous fréquentez utilisent maintenant ce système, alimentant une base de données dont Google est seul propriétaire. Il offre gratuitement aux propriétaires des sites une vue sur LEURS données, mais lui disposer de TOUTES ces données. Ainsi non content de savoir exactement tout ce que vous cherchez sur le net, Google grâce à ce système sait dans des proportions jamais atteintes ce que vous fabriquez sur la toile...
Pour m'éloigner un peu des chiffres officiels d'utilisation de Google Analytics, je me suis amusé à analyser tous les sites que j'ai visités hier, une centaine. Et le résultat est surprenant : 60% d'entre eux utilisent google analytics. Cela va d'AlloCine au Forum d'Ubuntu (!!), du site de Maitre Eolas aux petits blogs de campagnes en tout genre.
Point n'est besoin de me croire sur parole, vous pouvez vérifier tout cela par vous-même. Il suffit en effet d'ouvrir, par exemple, le site www.liberation.fr, cliquer-droit sur la page affichée pour demander à voir son code source. Dans ce code, allez aux dernières lignes. Vous verrez alors apparaître :
<script src="http://www.google-analytics.com/urchin.js" type="text/javascript"></script>
Techniquement, l'idée de base de ce système est d'inclure dans une page web un script qui se trouve chez google. Ce script est dynamique et permet à Google de collecter votre IP, d'en déduire votre pays ou votre ville, de connaître le site d'où vous venez, la taille de votre écran, votre système d'exploitation, le navigateur que vous utilisez, bref, beaucoup de choses qui prisent une à une ne semble pas porter à conséquence... Mais si vous imaginez que 60% des sites que vous utilisez alimentent la même base de donnée, vous concevez aisément que vos habitudes sur le nets sont vite bien connues de Google.
Bien sur, Google n'est pas le seul à jouer à ce jeu, nous pouvons par exemple citer le célèbre Xiti, l'acteur historique de ce marché, mais qui est du coup en net recul (moins de 10% de mes sites visités hier).
Déjà pourquoi bloquer ce système ? Là c'est avant tout une affaire de conviction personnelle. Je déteste simplement l'idée d'être tracé de manière aussi massive par un seul acteur du marché. Mais si cet argument ne vous convainc pas suffisamment, un autre serait que ce genre de système n'est pas transparent en terme de temps de chargement de page. En effet, rajouter une connexion vers Google pour chaque page que vous visitez ne peut être sans impacte. Ceci d'autant plus que certains sites cumulent avec un appel à XiTi, HitParade, etc... Bref, pour toutes ces raisons, moi, je vire...
Alors pour ne plus nourrir la bête, il n'y a pas 36 solutions, il faut bloquer l'accès au site www.google-analytics.com. Pour les utilisateurs de FireFox, rien de plus simple. Il suffit pour cela de télécharger l'indispensable extension AdBlock. Bien évidemment, je dis cela pour la forme, car vous avez sûrement déjà ce plugin vitale qui permet de filtrer les pubs qui inondent les pages que l'on visite quotidiennement.
Cette extension, une fois activée, va pouvoir être alimentée par une liste d'adresse à bannir. Même si ce système est initialement conçu pour bloquer les pubs, il se prête très bien à cette nouvelle utilisation. Il suffit pour blocker google Analytics d'aller dans les préférences d'AdBlock (Outils/AddBlock/Preferences) et d'ajouter :
www.google-analytics.com/*
Et comme il ne faut pas faire deux poids, deux mesures, vous pouvez aussi ajouter XiTi et "quelques" autres
www.google-analytics.com/*
*.xiti.com/*
*.hit-parade.com/*
*.toutlemondeenblogue.com/*
visit.geocities.com/*
*.yimg.com/*
*.cybermonitor.com/*
*.overture.com
*.mybloglog.com
*.webtrendslive.com
adnext.fr
*.quantserve.com/*
stats.wordpress.com/*
*.ixnp.com/*
*.statcounter.com/*
*.extreme-dm.com/*
*.googlesyndication.com/*
www.typepad.com/t/stats*
*.sitemeter.com/*
myustats.com/*
*.reinvigorate.net/*
*.clicktale.net/*
*.hittail.com/*
*/xiti.js
cetrk.com/*
Les nouvelles règles prennent effet dés la validation de la boite de préférences. Pour en être sur, il suffit de rentrer dans votre navigateur l'URL www.google-analytics.com. Lorsque vous validez, la page devrait vous indiquer qu'AdBlock l'a bloqué.
Une autre solution consiste à cacher l'adresse IP du site Google Analytics à votre navigateur. Pour cela il suffit de modifier votre fichier hosts et d'y ajouter la ligne
127.0.0.1 www.google-analytics.com
Cette solution a été redéveloppée ici.
L'idée du Web Gratuit a fait se développer des pratiques qui sont aujourd'hui à la limite de la violation des droits à la vie privée. SpyWare ou Google Analytics n'ont au fond, aucune différence si ce n'est que le dernier sera justifié par ses supporters en argumentant que c'est la contrepartie de la gratuité. Je n'ai rien contre en réalité, mais faut-il encore avoir été prévenu.
Merci pour les infos et les solutions
Je n'aime pas être suivi à la trace.
Comme protection je ne connaissais que "NoScript" : https://addons.mozilla.org/fr/firefox/addon/722
C'est sur que c'est la protection ultime
Je disais tout à l'heure qu'une protection moins violente serait un plugin qui filtrerait systématiquement les URL qui ne sont pas dans le domaine en cours de traitement.
Ca mettrais un petit coup sur le nez de la mode des Widgets 2.0 beta trucmuches mais cela aurait le mérite de respecter la régle de base "interdire d'abord, autoriser au cas par cas"
Une alternative (voire un complément) à Squid pour un réseau personnel ou de petite dimension est privoxy.
Une sort de proxy à la adblock en quelques sommes.
http://www.privoxy.org/
Disponible dans toutes bonnes distributions récentes de GNU/Linux.
Intéressant ça, je connaissais pas. Il gère le cache comme Squid ?
Il ne gère pas de cache, et uniquement le trafic http, pour ça que j'ai ajouter en complément de squid si besoin de faire du cache.
Son but est vraiment orienté filtrage http.
On peut imaginer par exemple une chaîne client -> squid (cache) -> privoxy -> internet
je n'accède et ne cache que le contenu "utile" ('n'en déplaise à Jack Lewis).
Ca se tient. Je sens que je ne vais pas tarder à mettre cela en oeuvre...
Merci de l'info en tout cas.
Pour le filtrage via adblock tu peut ajouter:
*/xiti.js (parce certain script xiti sont chez le particulier)
http://cetrk.com/* (traceur de visiteurs)
Voilà c'est rajouté, merci
Pour info, la même chose en syntaxe Privoxy donne:
/.*\/xiti\.js
Pour les webmasters qui voudraient obtenir des stats sur leur site sans passer par un service tel que Google Analytics ou xiti (et donc éviter d'alimenter leur base de données à la Big Brother) il existe un sympathique soft en php à mettre sur votre site : phpmyvisites. Le principe est le même mais c'est vous qui contrôlez tout.
Bof,... tous tracés, ca c'est sur, mais bon..... que Google connaisse la résolution de mon écran, je m'en balance!
Je bosse dans la pub online, et je peux t'affirmer que mediamétrie, avec un panel de 10000 visiteurs, arrive à sortir des estmiations plus fiables que google sur tes habitudes !!
Et google en sait bien plus sur toi lorsqu'il aditionne la somme de tes requetes sur son moteur que lorsqu'il cumule ses resultats Analytics.. ca leur fait vraiment une belle jambe chez Google, de voir que tu mattes des bandes annonces sur allo ciné avant de lire un article de libé!
Et si on va dans ce sens, il faudrait aussi se prémunir contre Free, qui cumule depuis bientot 10 ans les traces de TOUT CE QUE TU AS FAIT SUR LE NET, google analytics ou pas !!
comment faire pour les en empecher?
.....
impossible.
PS: cela dit, adblock est une très bonne extension
Oh bé tu sais, je suis pas un naïf non plus, et je n'ai pas de doute quant au fait que se rendre anonyme soit juste impossible. Mais tant qu'à faire, autant rendre les traces les plus réduites possibles. Et lorsque je constate en plus que je gagne 30% sur le temps de chargement d'une page une fois les traces et les pubs virées (via privoxy, voir l'autre article sur le sujet), c'est tout de même appréciable.
Maintenant quant à savoir si cela fait une belle jambe à google, ma foi, je n'ai pas trop de doute sur le fait que cela les intéresse encore plus qu'on ne l'imagine. Mais comme Pierrette, je n'aime pas bien que tous mes oeufs soient dans le même panier, donc urchin, me concernant, c'est out.
Tiens, tu devrais lire ceci, cela va t'amuser
http://artisan.karma-lab.net/node/1631
comment peut-on bloquer cette filature sur internet explorer? existe t-il un moyen?
Il n'y a pas de moyen à proprement parler. Tu peux effacer tes traces les plus évidentes (voir l'article sur privoxy qui fait un travail formidable), mais pour le reste il faut gérer ton image, choisir tes psoeudos, et garder en tête que quoi que tu écrives, et où que tu écrives, sur le net, c'est indélébile.
free fais comme tous les FAI, c'est dans le cadre juridique que les logs sont enregistrés
Oui... loi LEN II, avec un grand merci à M. Sarkozy.
Bonsoir,
Je crois avoir fait 1 fausse manip. et avoir décoché une case de Adblock? Comment puis-je être sûr que google ana est bien bloqué?
Et si j'ai réellement fait 1 mauvaise manip. comment le rebloquer?
Est-ce que c'est bon (càd, bien bloqué) quand google ana est inscrit en rouge quand je clique sur le bouton Adblock en bas de la page Firefox?
Il me semble le rappler que ce qui est en rouche est bloqué par je n'utilise plus addblock depuis longtemps déjà, j'utilise privoxy à la place.
Sinon une bonne manière de savoir ce que firefox fabrique et aussi valider le comportement d'AdBlock, c'est d'installer l'extension firebug. Une fois installé suffit de l'activer par F12, de cliquer sur l'onglet Net et de recharger un page douteuse pour voir ce que firefox télécharge réellement.
Pour info, ton article est cité sur arrêt sur image ... bon certes dans les commentaires

Puis-je encore te tutoyer ?
http://arretsurimages.net/post/2007/10/07/35-000-a-savoir-que-TF1-vous-ment
Arf oui, ça va aller tu peux continuer. En plus vu le niveau d'arrêt sur image, mes chevilles n'ont pas pris un millimètre
Contrairement à toi, j'ai été navré de la disparition de cette émission qui nous donnait une autre vision du PAF français...
Après la suppression de '90 minutes', du décalage de 'las-bas si j'y suis', que nous reste-il ?
ben je suis pas très navré car je n'ai point de télé
Donc, arrêt sur image, j'ai découvert cela sur le net et pour l'instant on peut pas dire que cela m'ait trouvé d'intelligence. Mais les deux contenus n'ont peut-être aucun rapport.
au risque de continuer le HS sur ce magnifique tuto
, j'ai un point de vue qui va peut-être vous réconcilier :
Du temps d'arrêt sur images à la télé (sur arte), je trouvais l'émission très intéressante car c'était la seule qui faisait des comparatifs sur la façon dont la même info était traitée sur TF1, FR2 ... avec des enquêtes un peu plus poussées qui montraient aussi ce que les télé ne montraient pas (maintenant y'a scoopéo
).
Depuis qu'ils se sont fait virer de l'antenne (il est clair que l'émission devait déranger certaines personnes), Schneiderman a lancé son site sur lequel je ne retrouve pas la qualité de ses émissions télé ; sans doute le format web n'est pas sa tasse de thé, mais je crois surtout qu'il s'est un peu trop "radicalisé" et cela rend son propos trop souvent orienté à mon goût (genre limite théorie de la conspiration par moments).
Bon, il est vrai que je ne me suis pas beaucoup arrêtè sur le site et que depuis ça sent un peu l'esprit revanchard
N'empêche que l'on a plus grand chose à se mettre sous la dent.
top là Ulhume
Au final est ce que ces maigres protections sont vraiment utiles ?
Notre vie privée est-elle réèllement protégée ?
Ca fait froid dans le dos : http://www.voltairenet.net/article155237.html
Et oui... c'est la fameuse loi LEN2 qu'a fait passé, entre autre joyeuseté notre nain-culte...
Maintenant, privoxy n'a aucune prétention dans ce domaine. Son but est juste de te protéger des rapaces vendeurs de soupe. Pour ce qui est des état, tu as l'onion routing (genre TOR) mais là, je ne suis pas sur que le remède ne soit pas pire que le mal.
merci pour les indics, une chose me préoccupe peut on éviter de se faire tracer par un serveur proxy en entreprise?
merci de bien vouloir m'aider
Pour cela, il te faut un proxy qui soit installé sur une machine à toi et accessible via HTTPS. C'est en gros le seule moyen. Cela tombe bien, je comptais faire un papier sur celui que j'utilise sous peu. Donc attends quelque temps et reviens voir en home page.
Il y a aussi moyen de passer en encapsulant dans de l'icmp ou dans des packets DNS, bien sur si ces protocoles sont ouverts sur Internet, ce qui est parfois le cas. Mais c'est vrai que par l'https c'est imparable, du moins si l'admin réseau ne travaille pas en white list. (tout bloqué sauf les sites autorisés), qui est rarement le cas, ça réclame trop de travail
@Dab
"ça réclame trop de travail" Tu en sais quelque chose ?
Pour info, j'ai écris un article rapide sur ce sujet:
http://artisan.karma-lab.net/node/1531
Pas trop vite je n'ai même plus le temps de lire tes articles
Ouah ... "Cela tombe bien, je comptais faire un papier sur celui que j'utilise sous peu"
Le 'sous peu' est pris au pied de la lettre
@Dab, j'ai un nouveau clavier magique, je vais deux fois plus vite avec, j'en profite
Poster un nouveau commentaire